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(54) Identification de g&tes de Lactobacillus delbmeckD subsp bulgaricus LIB impllqu^s dans la 
biosynthfese cTexopofysaccftarides 

(57) Enzyme recombinde, Susceptible <fGtre impfiqt^e dans la biosynthtee de {'EPS ayant Punrte saccharidique 
r6p6trtfve 
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catalysant spScrflquement rune des Rafeona sulvantes entre sucres: (1) la fiaison oskfjque p-1,3 entre le carbone 1 cTun 
D-Galp activ6 et la caibone 3 du suae present a rextrdmrW norK6ductrice d'une chalne saccharidique en formation- 
(2) la liaison osidique 0-1 .4 entre le carbone 1 dVn D-Ga|p aclivd at I© caibone 4 du Sucre pnfeerrt * ftsxtr6mit6 non' 
rSductrfce d'une chdtae saccharidique en formation; (3) la liaison osidique a-1 ,3 entre le carbone 1 cfun L-Rhap activ6 
et le carbone 3 du Sucre pr feent & I ? extr6mrte norvr^ductrice dime char ne saccharidique en formation; Jesd tes ctatfne- 
s&ant conpos^es notamment d'une chaTne princfcale de 1 A 4 D-Galp et/ou D-Glcp Ii6s entre-eux par des liaisons osi- 
diques <t-1 A a-1.3. p-1,4 et/ou p^1~3, et lesdrte sucres presents aux exlr&ritfe non-r6ductrices 6tam life km seal 
autre sucre par son caibone 1. L'invention concerne aussi tout ADN recombinant codant pour une enzyme recombin6e 
selon Hnvention, ainsi que toutes cellules comprenant, irrt6gn§es dans son g&nome ou par le moyen d*un plasmide 
rSplicaUe, un AON recombin6, et axprimant une enzyme recombinSe fonctionnelle selon 1'invention. Enfin Hnvention 
concerne un proc6d6 de production d'un EPS, dans lequeJ (i) on clone dans un vacteur un fragment d'ADN codant 
pour au moins lima des enzymes selon Hnvention. ledft vecteur comprenant en outre une sequence permettant la repli- 
cation autonome ou (Integration dans une cellule hdte. (2) on transforme une cellule hftte par I edit vecteur, ladite cellule 
bote utilrsant les enzymes codSes par le vecteur, le cas 6ch6ant en combinaison avec d'autres enzymes produte par 
la cellule hflte, pour la biosynthtee d'un EPS, (3) puis on cultive la cellule hOte transform^ dans des conditions apcro- 
prtees pour fa production d'un EPS. 
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Description 

[0001 ] La pr&ente Invention se rapporte & de nouvelles fa actions enzymatiques de baddies lactiques afi mentaires, 
ainsi que de nouveaux enzymes et g$nes, impliques dans la biosynthtee d'exopoiysacchartdes. 

s 

gtatdelatechnroue 

[0002] n est connu que les bacteries lactiques sont susceptbles de produire dan$ leur milieu de culture deux classes 
de polysaccharides. & savoir les homopol /saccharides comme les daxtranes ou les levanes qui sont constitute par 

10 I'assemblage r6p6t6 d'un seul sucre, et les heteropdysaccharides appeiee communemerrt exopolysaccharides ou EPS 
(EPS est I'abrfriation du terme "exopdysacsharide") constitute par ('assemblage de plusieurs sucres differents for- 
mant une unite repetitive (Cerning J., Bacteries lactiques, Vol I, de Rossart H et Luquet F. M., Lorica, 309-329. 1994). 
[0003] Une bacteria lactique afimentaire produisant un EPS peut confer er un caractere filant et/ou une texture Hsse 
et cr6meuse & un (ait acidiftt {Cerning et aA, FEMS Microbiol., SL 113-130, 19/90). Les EPS peuvent aussi presenter 

is des activrtes biologiques partfcuKfcrement interessantes pour la sant6 humaine ou an [male, comme dee activates anti- 
tumeurs ou prcbiotiques, par exemple (Oda M. et a/., Agnc Biol. Chem., & 1623-1625, 1983; EP948701396) 
[0004] Par aflleurs, nndustrie alimentaire est confrontee & une instability g^ndique de la biosyrthdse des EPS dans 
les bacteries lactiques. Ceci se tradurt g6n6ralement au cours dune fermentation par la perte de la production d'EPS 
par tout ou parte des baddies lactiques (voir "Cerning J. fc cWessus). Les produits ferments mdustriels sont ainsi 

20 sujets & des variations dans leur contenu en EPS. ce qui n est pas toujours acceptable. Pour remedier k ces probl&mes* 
t Industrie recours actueltement k Hsolement et la caract$risation periodique de ses bacteries de manidra & stiparer cel- 
los qui ont perdu leur caracttre engine!. 

[0005] On oonnart des gdnes de bacteries lactiques alimerrtaires impfiqufe dans la biosynthdse d'EPS 

[0006] WO92/02142 r$veie ainsi I'exJstence du plasrnde pHV67 qui produit dans Lactococcus lacte subsp. tacfo 

25 (mfeopfole) une substance capable d'augmenter la viscosity d'un lart ferments. La structure saccharidique de cette 
substance n*6tartt pas connue, les CBff erentes fbnctions des enzymes cod6es par pHV07 sont 6gaiement inconnues. 
[0007] US5066588 ddcrit deux plasmides provenant d"une souche de Streptococcus cremoris (m&cphile) capable 
de conf 6rer un caractere epaississant k un Streptococcus lactis. La structure saccharfcfique de cat 6pai sstssarrt n'6tant 
pas connue, les differ entes fbnctions des enzymes oodles par ces plasmides sont ggafement inconnues. 

30 [0008] Vesccwo et at, ont mis en evidence un plasmjde cTune souche Lactobacillus easel subsp. case/ (m4scphfle) 
codant pour un phenotype Muc+, e'est k dire pour dee fbnctions H6e$ k la production cT6pais$issants exoceBulairas 
(Vescovo era/.. Biotechnology Letters, VW II, 709-712, 1089). La structure saccharidique de cet epaississartt n'&ant 
pas connue, les differentes fcnetions des enzymes oodles par ce plasmide sont egalement inconnues. 
[0009] EP750043 (Soci6t6 des Produits Nestte) decrtt un op6ron de genes de la souche Streptococcus thermophHus 

35 CNCM 1-1 590 impiiqu* dans la synthase cf un EPS ayant la structure repetitive suivante. 
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[001 0] Des travaux men6s sur ces enzymes (rGcuftais non-pubiies) ont perrrts de montrer que la biosynttese de cet 
EPS se fait de maniere progressive avec. k chaque etape, I'adclffion d"une nouveile unite de sucre qui vient s'atfacher 
par sa fonction sami-acetalique k un hydroxyie alcoofique dune autre unitd de sucre, Isquelle est k TextremM <f une 
so cheSne de sucres Ii6e k une amorce. Ces enzymes cataJysent ou contrdlent ainsi sp6cifiquemertt les fonctions survan- 
tes. 

(1) La naison sous forme d'un isomere a ou p entre le carbone 1 (qui porte la fonction r&Juctrice aldehyde) d'un r> 
Gaip active et un phosphate d*une amorce iipophiBque notamment du genre und6capr6nol. ou proteique notam- 

55 ment du genre ACP (Acyl Carrier Protein), par exemple. 

(2) La liaison osidique o-1 ,3 entre te carbone 1 d'un GalpNAc active (UDP-GalpNAc) et le carbone 3 du D-Galp (ie 
k son amorce. 

(3) La liaison osidique p-1.3 entre le carbone 1 d'un D-QIcp active (UDP-D-Glcp) et le carbone 3 du sucre present 
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& rextr§mit6 non-r$ductrics de la chaTne p-D-GaJp(1->3)-ayp-D-Galp-aniorca 

(4) La liaison osidique a-1,6 entre le carbone 1 dun D-Galp activ6 et Is Carbon© 6 du sue re present £ I*extr6mit6 
norw&fuctrice de la chatne p-l>^c^(l^)p-D-Galp(1^)c^DK3alp^arnorce. 

(5) Le transport des unhds saccharidiques r6p&itives de I'EPS d6crit ci-dessus k Textfriaur de la cellule bact§- 
5 rienna 

(6) La liaison osidique p-1 ,3 entre lee unrtds saccharidiques rGpStrtives de ('EPS ckJessus. 

(7) La regulation du nombre d'unit6s saccharidiques dans I'EPS, et done de son poids motecufaire final. 

[001 11 Van Kranenburg et al. ont aussi d6crit un op&on de g&ies, present sur un plasmide d'une eouche Lactococ- 
10 cvs lactis, tmpfiqu6 dans la synthase (fun EPS ayant la structure r6p6trtrve suivante (Mol. Microbiology; 24, 387*397, 
1997). 



-^)-P^D-Ga!p(l-^)-p-D-Glcp(l->4>|^EM31ciKI-> 
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[001 2] Bien que les enzymes codant pour cat EPS soient maintenant cormues, il reste encore h Judder la $p6cificit6 
ss de chaque enzyme. Pour le moment on peut valablement supposer. au regard des homologies avec cfautres opdrons 
impliqu66 dans la biosynthGse de polysaccharides, que la biosynthdse ctebute par la liaison d*un Qkp ac&vd sur une 
amorce lipophilique ou protftique. 

[001 3] Les connaissances relatives & la biosynthtee des EPS dans las bact&i es lactiques alimentaires sont encore 
neanmains tr6s fragmentaires. Gependant il est maintenant acWs que. baste sur les structures cfEPS 6futid6es 

so jusqu'ft present at par analogie avec la production de composes tels que les lipopolysaccharides (WhrtfieH et a/., Adv. 
Microbid. Physiol.. 35. 136-246, 1993), la synthase debute par l^actrvafon de monom&res de sucres (glucose, galac- 
tose...) en sucres nud&rtkfiques utilises comme pr 6curseurs par les gfycosyrtransf Erases. La premiere etape de la bio- 
synthase de YutM r6p6tffive est catalyse par una glycosyltransfdrase particulfere qui reconnaTt d'une part, un 
pr6eurseur de type suae nucf6oWique et, d'autre part, une amorce Gpophffiqua, notamment du genre und6capr6nof- 

35 phosphate, ou proteique notamment du genre ACP, par example. Lee autre* grycosyttransf Erases agissent ensurte 
sdquentiellement en ajoutarrt un sucre sp6crfique sur run W r6p6tftive en construction. Les unites r6p&rtives complies 
sont ensuite exporttes vers le milieu extracetlulaire avant d'etre polym6ris6e& 

[0014] A co jour, il exists toujours un besoin de disposer de nouveiles enzymes impfiqu6es dans la synthase cfEPS, 
et notamment des enzymes catalysant des Baisons spWfiques entre des sucres. La pr6sente invention vise A remplir 
40 ces besoins. 

[0015] A cet effet, la prteente invention concerns toute enzyme recombin6e, que I'cn peut purifier et qui est suscep- 
45 tible d'etre impliqute dans la btosynthtee de I'EPS ayant I'unit* saocharidique repetitive suivante. 
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et catalysant sptoflquement; 

- la liaison osidique p-1 ,3 entre le carbone 1 d\in O-Galp activS et le carbone 3 du sucre present k I'extrSmte non- 
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r6dudrice cf une chaTne saccharidique en formation, ladite chaThe 6tartt compost notamment dime chain© prin- 
cipale de 1 k 4 D-GaJp et/ou D-Gtep lite entre-eux par des liaisons osidiques a-1.2. a-1 ,3, p-1 ,4 et/ou JM .3. et ledit 
Sucre present k Yetir&ritt norw6ductrice &ant lid d un seul autre sucre par son carbone 1 ; 

- la liaison osidique 3-1 ,4 errtre le carbone 1 d'un D-Galp active et le carbons 4 du sucre present k rextr6mrt6 non- 
* nkiuctrice <fune chaTne saccharidique en formation, ladite chaTne 6tant composte notamment d'une chatne prin- 

cipaJe de 1 £ 4. D-Galp et/ou D-Gtep lite entre-eux par des liaisons ostoiques a-1 ,2, a-1 ,3, p-1 ,4 et/ou p-1 .3. et ledit 
Sucre prteent k l'extr6mM norw6ductrtee Slant 116 Aim seul autre sucre par son carbone 1 ; 

- la liaison osidkjua a-1 ,3 entre le carbone 1 d*un L-Rhap active et le carbone 3 du sucre present k rextremrte non- 
reductrice tfune chaTne saccharidique en formation, ladite chafne tent compose notamment d'une chaTne prin- 
ter dpale de 1 k 4 D-Galp et/ou D-Ocp lite entre-eux par des liaisons osidiques a-1 ,2, a-1 ,3, p-1 ,4 et/ou (3-1 ,3. et I edit 

sucre present k I'extr6mit6 non-rWuctrice etant G e k un seul autre sucre par son carbone 1 . 

[0016] Un autre otyet de Unvention conceme tout ADN recombine codant pour une enzyme sekxi (Invention, et 
notamment tout vecteur cTADN ou toute cellule renfermant un tei ADN recombine, et expdmant une enzyme recomhi- 
is neefonctionnelle. 

[001 7] Un autre objet de rinvention conceme un precede de production cf un EPS, dans lequel {1) on done dans un 
vecteur un fragment d'ADN codant pour au moms rune des enzymes seton rinvention, tedH vecteur comprenant en 
outre une sequence permettant la replication autonome ou tintegration dans une cellule hate, (2) on transforms une 
cellule hdte par lecfit vecteur, ladite cellule hOte utifeant les enzymes cod6es par le vecteur, le cas tehtent en combi- 
ne* naison avec d'autres enzymes produite par la cellule hOte, pour la biosynthtee tfun EPS, (3) puis on cutive la cellule 
note transform6e dans des cendtions apprapri6es pour la production tfun EPS. 

[001 8] Enf in, un dernier objet de la prteente invention conceme l\rtifeation d'une enzyme recombinSe selon nnveiv 
tion, ou cfun ADN selon invention, pour la synthtee dVn EPS. 



25 Description de la figure 

[0019] La figure 1 represent* la carte physique de Toplron impHque dans la synthase de TEPS de la souche S. 
thermophitus CNCM 1-600. Les ffeches horizontal es indfcjuent fa presence de cadres de lectures (ORF) potentials. Les 
noms des genes correspondants aux ORFs sent indiqute en dessous des fleches* 

30 

Description d6tafll6a da llnvenfon 



[0020] Dans la suite de la description, les sequences en nudfiotides des g£nes ou amorces utilises, ainsi que les 
sequences en acides amines des enzymes recombinees, sont representees dans la fctede sequence foumied-apres, 

ss et sont nommees, pour des raisons de simplification, sous les sigtes nunerotte "SEQ ID NO:*. 

[0021] Le terms "CPS" designe un polymdre forme par la condensation d'un grand nombre de molecules de sucres 
0 oses) de types differents. Cat EPS est plus particufieremem consGtue par rassemblage rfipete cfune seule unite sac- 
charidique, eite-mfime form6e d'une diaTne principals de sucres dont les extr6mites sont irrpltquees dans la polymeri- 
sation des unites. Cette tfratne prindpale peut comprendre en outre des ramifications de sucres qui ne sont pas 

4o impliqu6es dans la polymerisation des unites, lesdites ramifications etant grefffies par des liaisons osidiques sur un ou 
plusieurs sucres de cette chafne. 

[0022] On represents une unite saccharidique en indiquant (1) les sigles usuels des sucres (Glc: glucose; Gal: galac- 
tose; Rha: rhamnosB; etc) ; (2) le type de chaque liaison osidique sous fa forme d'unefieche entre les numeros de car- 
bone de deux sucres adjacents (les rumeros de carbone atbfoute sur le cyde d'un sucre etant ceux reconnus par la 
45 nomerwlatureint^^ 

p, ledit sigle etant pbsitionne k gauche (Tun sucre pour indiquer ranom6rie de la liaison osidique presente k la droite de 
ce sucre; (4) la nature pyranose ou furanose de chaque sucre en adjoignant la lattre p ou fjuste apres le sigfe de cha- 
que sucre ; (5) et fa serie D ou Lde chaque sucre, en poshionnant la lettre k gauche du sucre concern*. 
[0023] Dans une chaTne saccharidique en formation, la reaction directs entre une fonction semi-acetalique d'un* nou- 

so velle unite de sucre et un hydroxyle alcoolique du sucre present k Textrerrtte norweductrice de la chalne ne se fait 
spontanement, et e'est pourquoi le groupement semi-acetalique doit au pnialable fitre active, c'est-A-dire rendu plus 
reactif en vue de la formation de la liaison osidique, Cette activation est catalys6e par des enzymes bacteriennes tor- 
ment un sucre nucl6oWique. et plus particuiierement un uridine-diphosphate de D-Glcp (UDP-GJcp) ou D-Galp (UDP- 
Galp), ou une thymidine^iphosphate de L-Rhap (TDP-Rhap) dans le contexts de la presents invention. Pour initier fa 

55 formation d'un chafne saccharidique, un premier sucre active doit d'abord dtre tie sur le phosphate cfune amorce Hpo- 
phiiique ou proteique. L'addition cTune nouvefle unite de suae active sur la chaTne se fera ensuite par sa fonction semi- 
acetafique au niveau d'un hydroxyle alcoolique du sucre prteent k Pexiremrte non^eductrice de cette ChaTne, Cest-A- 
dire k rextremite opposte de celle ou ramorce est fix6e. 
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[0024] Dans la suite de la description, on represente une chaTne saccharidique en formatioa en indiquant les sigles 
usuefcs des sucres, les types de liaisons osidiques (ycomprisranom6rie), la position del'amorce sur fa chains, la nature 
du cycle et de la seria D ou L de chaque Sucre. Du tail que I'on ne sail pas encore quel isomere est forme lorsque le 
premier sucre dune chaTne est lie a une amorce, par commodite d'ecriture, on utilise aussi le sigle "a/0" afin tfindiquer 
que I'un dee deux isomeres est forme. L'emplacementdune ramification sur une chaTne saccharidique peut Stre ega- 
lement indique dans une chaTne par la presence de crochets a I'interieur desquels les sucres, les types de liaisons osi- 
diques et la nature du cycle et de la serie D ou L de chaque sucre sont represent 6s, chaque crochet etant positionne k 
gauche du sucre sur lequel ia ramification est greffee. 

[0025] Au sens de la presents invention, on emend par "sequence homologue" toute sequence nucl6ot»dique ou rfaci- 
des airings, conduisant ou donnant un variant tfenzyme qui catalyse I'assembiage de sucres, ne different das sequen- 
ces selon nnvention que par la sitstrtutcn. la deletion ou I'addition dun petit nombre de bases nudeotidiques ou 
d'atides amines, par example 1 0 150 pajres de bases (pb) ou 1 a 50 ackjes amines. Ces variants d'enzyme peuvent 
conserver la meme specificite dassemblage de sucres que les enzymes dont ils derivent La substitution, la deletion 
ou I'addition oVi petit nombre dacides amines peut cependam aussi conduire a changer la specificite enzymatique 
is [0026] La Section cfune sequence homologue est constd6r6a comme evidente pour I'homme du mStier, puisque Ton 
peut facilement creer des variants <f enzymes selon Unvention. en mettant en oeuvre des methodes de mutagenese 
classiques, et notamment en adaptant les methodes decrites par Adams etal. (EP4024S0; Genencor), par Dunn et al 
(Protein Engineering, 2, 283-291 , 1 388). par Greener etal. (Strategies, 7, 32-34, 1994) et/ou par Deng et si (Anal Bio 
chem, 20& 81. 1992), par example. 
so [0027] Dans ce cadre, on consjdetrera en part'culier comme homologues deux sequences d'ADN qui, du fait de la 
degenerescence du code genetkjua, cedent pour un meme polypeptide. De meme. on peut aussi considerer comme 
homologue deux sequences d'ADN sftybridant dans des conditions stringentes, Cest-a-dire sftyhridant toujours acres 

!!SJT!t!SIST^^ ™° ( ^ dflnt 15h dans un *M>M*6on (SSPE 1.5x: 0,22S M de Naa 0,0015 M 
t M de NaH * p 04. PH7 ; 1% de SDS et 1% de lait d&hydrate). suMe de 0 topes successives de lavage 

& a KPC dans un tampon comprenant differentes dilutions deSSC 10x[i,5M de Nad, 0,15 M de citrate de sodium. 
pH7) et 0,1% SDS, respectivement pendant 2 fois 10 min avec du SSC 2x. pendant 2 fois 10 min ayes du SSC 1x et 
pendant 2 lots S min avec du SSC 0,1x. 

[0028] On peut aussi considerer comme homologues lea sequences d'ADN presertant plus de 50% cfiderrtite avec 
les sequences seton llnventioa en perticulier plus de 70%, I'iderrtte etant determine par le rapport entre le nombre 
so de bases nudeotidiques dune sequence homologue qui sent identiques a celles dune sequence selon nnvention et 
le nombre total de bases nudeotidiques de ladite sequence selon llrwention. par example. 
[0029] De mfime, on considerera comma homologues deux prolines fonctionneDes qui sort reconmies par in meme 
anticorps. le rapport des valeure dl mensite de reconnaissance des deux proteines par rartjeorps n'excedant pas 1 000 
dans un test EUSA. de preference 100, par exempie. On considerera plus partfcuKerement comma homologues les 
3 , U !" C i!L en 63 wn,n68 qui P rfeentert P 1 " 8 dB 70% didentrt6 avec les sequences salon (invention, en part'culier 
plus de 80% ou 90%, Dans ce dernier cas. Ildentfte est determinee par le rapport entre le nombre (Tackles amines 
dune sequence homologue qui sont identiques a celles dune sequence selon Unvention, et le nombre total decides 
amines de ladite sequence selon nnvention. 

[0030] Pourisoler un ADN recombine selon la presente invention. HestpossUede constrtuer une banque de grands 
fragments d'ADN dune bacteria lactique produisant un EPS dans une bacterie lactique ne produisant pas cfEPS puis 
deselect onner leou les elone(s) produisant un EPS. Pour cola, on digere TADN genomJque d'une bacterie lactique 
produttuit un EPS par une enzyme da restriction qui est spedfique dun site de restriction relatrvement rare (fiamHI 
Safl. ftfO ou par une digestion partialis avec SSu3A, par exempie. On done le produA de digestion dans un ptasmide 
iTf?* 1 ^ 0 d ' nt ^!^ qui SCC8pte * srands figments (ptosntte pSA3. Dao etal., Appi. Environ. Microbiol., 
SJ* >. 1 ' ^ 00 urt 188 P ,a6mktes '««"*inants dans une espece identique ou procha ne produisant pas 
d EPS. telle que Lactobacillus hetefojs ou Lactococcus lactis. Errfki on seiectionne au moins un cbneftansfarme pn> 
fe^dEPS. PUIS ° n id8nti,5e ' ™ ^ e * ons ^ UCTceda ^ uementlefr agmeritrfADN responsabiedelapmduc. 
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[0031] Vu que les ADN recombines selon la presente invention sont susceptibles d'etre de grande taiUe, du fait qulis 
Pf^^lf*? un , *°f 6 de S^es impliques dans la bfosynthese dEPS on peut pref erer Introduire les plasrrtdes 
recombinants dans la meme souche de bacterie lactique dont provienne les fragments, a la difference pros que cette 

S HjiST* 1 ' a CaP8Cit6 ^ Pr ° dUire EPS 6086 4 traftemenl mufa 8 & *»» (dement U.V., chJmjque ou par 
(0032] Une autre alternative consists k preparer des amorces nudeotidiques derivees de genes connus imoi/oues 
dans la hosynthese dun EPS, puis a realiser une PGR sur I'ADN genomique dune bacterie lactique produisant un EPS 
et pour laqueDe on desire Klentif ier les genes impliquesdans la biosynthese de oat EPS. CeUe technique est cependant 
excesswement drff-ale k mettre en oeuvre. car le chdx de la sequence nudeotidique des amorces sera determinants 
dans Irsolement dun gene. Puisque I'on ne connaTt pas d'avance les homologies entre les genes recherches et les 
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[0033] Quelques crneres P^"''^ selection de sequences nucleotidiques conserve* en comparart 

v6e souvent lots de la biosynthese dun EPS . (2) I a ^ sequences consents 

dont le conteru en nucleotides GC se rapproche le pais ^™°V?* rP trcuv6es dans des organismes etoignte 
phylogeniquement de I i^^^ fidenttf taalion d"une partiedans les sequences conservees qui est peu 

S^^CSSK ^SSSU The Norlands. Sept 1993: Sat* eta/.. 

1?^L» ™7^^m deTenes imoliaufe dans la biosynthese dMn EPS. Neanmoins. llrcmme du meter peut tea- 

de^esSiques basees sur un fragment isole. un ou plusieum clones rerferma* la parte restarts, par 

S' 6 ' On a du ainsi caracttriser une sequence d'ADN de 9.2 Kb de la souctie Lactobacillus detbweeti Mgaricus 
KpcSe le^ St^SSS^i *fi de Budapest, auprte de la Section Natonale de 
StTcM), aSrueduDocteur Roux. 76724 Paris cedex 15. ^^^^^^^ 
800. Par aillaurs, cette souche Grampositif presents au microscope un sspect de ^Jl^S^slSe 
^ Irf n^noniarte et anaeorobe facultative. Toutes les restrictions concerrant la disponitxlite de cette souche 
t^ZSSSl I^Se la d^ance dun brevet respondent a la presente demands ou une autre 

de I'EPS ayant b structure r6petee suivante. 

35 (3-D-GaIp a-L-Rhap $-D-Gz]p 

1 1 1 

4 3 3 

^3)-p-D<JaW^)- a * D ^^ 1 ^ 2 )^- D - Gal ^ 1 " >3) "^ D * GIc/ ' (l ' > 
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100381 Grace aux connaissances acquises sur la biosynthtee des EPS decrits dans la Mterature, notamment de 
I'EPS dedans EP750043 (resultatsnon-publies). on apu ainsi identifier les nouvellesfonctions er«zymafcques jmpB- 
quees dans la biosynthese de I'EPS ci-dessus. Les nouwellas enzymes impliquees dans la synthase de cet EPS peu- 
verrt ainsi catalyser specifiquement rune des nouvelles liaisons sun/antes entre sucres: 

- la liaison osidique p-1 .3 entre le carbone 1 dim D-Galp active et le caibone 3 du sucre prfisent a rextrfimM non- 
r&iuctrice dune chalne saccharidique en fermation. ladite chaDie etant composes notamment d'une chalne prin- 
cipalede 1 a*0-Galp et/ouD-Glcp Ses entre-euxpardesliaisonsosidiquesa-1.2, a-1 A p-i,4et/bu p-1.3. etletftt 
Sucre present a I'extrfemite non-r&luctrice Slant lie a un seul autre suae par son carbone 1: 

- la liaison osidique p-1 .4 entre le caibone 1 d'un D-Galp active et le carbone 4 du sucre present* I'exMmM non- 
r«uctrice d'une chalne saccharidique en formation, ladite ehalhe etant composte notamment a^e<tonepnn. 
cipale de 1 a 4 D-Galp et/ou D-Glcp fids entre-eux par des liaisons oskiiques a-1,2, a-1 .3. p-1 ,4 eVou p-1 .3. et leat 
sucre present a I'extremite non-rdductrice 6tant lie a un seul autre sucre par son carbone 1 ; 
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- la liaison oskfique c-1 .3 entre te cartoons 1 dun L-Rhap active et (e carbone 3 du sucre present a raxtr6mjte non- 
r6ductrice d'une chaTne saccharidique en formation, lacfite chaTne tent composte notamment cTune chaTne prin- 
cipale de 1 a 4 D-GaJp et/ou D-Gcp life entre-eux par des liaisons osidiques a-1 .2, a-1 ,8, p-1 ,4 et/ou p-1 ,3, et ledit 
sucre present a I'extremite non-reductrice etant lie a un seul autre Sucre par son carbone 1. 

[0039] La chaTne saccharidique en formation petit etre composes simplement d'une chaTne principale sans rairtfica- 
tion de 1 a 4 D-Galp et/ou D-Ctep lite entre-eux par des liaisons osidiques a-1,2, a-1 ,3. 0-1.4 et/ou p-1-3. 
[00401 A titre d'exemple, cette cnalne peut etre choisie par mi les chaTnes tetra-sacchricDques suivantes, ainsi qua 
lairs precurseurs mono-, di-. ou tri-saecharidique(s): 
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o-D-(^p(1^)-p-D-Glcp(W3)>D^lp(l^>«^D^p^noice: 
a-0^|p(i^)^-D^p(t^).p.OrCBv(1^)-f/a'D^p«noree; 
p-D-Galp{1 ->4)^-D-Ga!p<1 ->2)-a-D-Galp(1 ->3)-p/a-D-GJcp-amorce ; et 

p-D-Glcp(i^).p^O^|p(i^4)^-p^aip(i_>2)^o-D-Galp-amoree. 



(0041J La cnalne saccharidique en formation peut etre aussi composee cTune chaTne princfcale comprennant en 
outre 1 ou 2 sucres ramifies, tefs que D-6aJp et/bu L-Rhap. Ces sucres ramifies peuvent &re lies sur la chains princi- 
pale en p-1 ,3, p-1 ,4 ou a-1 ,3, par example. 

[00421 A Wre d'exemple, cette chEtfne peut Stre choisie parmi les chatnes prindpaies tetra-sacchricfaues suivantes 
20 ainsi que leurs precurseurs mono-, di-. ou tri-saccharidique(s): ' ' 

«-o-Gaip<i-*3)-p-€-Gicp(i^Mp:r>^ 

«-f^Pt1^HP-D^P(1^)l^-b-Gi4p(1^)^^ 

p^i>Gato{i.*Ha-Rnap<i^)]^-p-Gaipa^ 
* l>D-Gicp(i^Mp.D-Gaip(i^)hp-r><^ 
Galp -amorce. 

I 00 * 31 , °? Pftffrence. une des naiveties enzymes seton Unvenbon catalyse la liaison osidique a- 1,3 entre le carfxne 
1 d'un L-Rhap active et le carbone 3 du galactose present & I'extremite non-riductrlce d'une des chaTnes saccharide 
so ques d-dessus. 

[0044] De preference, une des nouvelles enzymes seton rinvention catalyse la liaison osktique p-1 3 entre le carbone 
1 d'un D-Galp active et le cartxme 3 du galactose present a I'extremite non-r6ductrice d'une des chatnes saccharidi- 
quas ci-dessus. 

[0045] De preference aussi, une des nouvelles enzymes sefon Unvention catalyse la liaison osidique 3-1.4 entre le 
1 rfwi D-Galp active at le cartxme 4 du galactose present k I'extremite non-r6ductrice d'une des chaines sac- 
cnandiques ci-dessus. 

[00461 Les nouvelles enzymes recombinees, jdentifiees a partjr de la sequence d'ADN da 9.2 kb. ont rune des 
fr^-T,"^ 68 amin& choisie dare le aroupe da sequences SEQ ID N02. SEQ ID N03, SEQ ID NO 4 SEQ 
ID NO:5. SEQ ID NO:6. SEQ ID NOT. SEQ ID NO*. SEQ ID NO:9. SEQ ID NO:10, et les sequences qui leur sort 

[0047] La presente invention vise egalement tout ADN recombine codant pour une enzyme selon Unvention Cast a 
dire rune des enzymes choisie dans le groupe de sequences SEQ ID N02. SEQ ID NO* SEQ ID NO-4 SEQ id 
NO*, SEQ ID NO*. SEQ ID NO:7. SEQ ID NO*. SEQ ID NO* et SEQ ID^O:1C L En rADN ip^o£ 
prendre au mo«s un gene ayant rune des sequences nudeoWiques choisie parmi les sequences delimits dans la 
sequence SEQ ID NO:1 par les nucleotides 9*53, 516-1292. 1323-1982. 2074-3174, 324*4373, 4511-5317 5335. 
6204. 6709-7692, 7723-8784. et les sequences qui leur sent homotogues. 

!Si rt ^l^J^° n ^^! art V f 6Ur recoft * inant corrprenant un ADN selon Unvention. Ce vecteur 
recombinant peut etre tout fragment d'ADN, ample ou double brin. Gneaire ou circulaire, d'expression ou dlntearatioa 
et oomprenant une sequence d'ADN selon Unvention. notamment tout ou parte de la sequence SEQ ID NO t Dane le 
™„2 ' e ,.ff d6 , d6 !f ^ EP564966 neser ^^ "fi«se {voir d-apres). il faut veiller a ce que le vecteur putesa 
e^nmer \ ADN seton (Invention par des sequences nucfSiques adaptees (promoteur; site cfattachement du rtoosome: 
codon pr6f6re par I orgamsme note. etc.). et le cas echtont a ce qu'il comprenne une ou plusieure origines de rtefica- 
tion cellulaire, notamment d'Escherichia coli et/ou d'un Sfreptococcus, par exemple. 

[0049] Ainsi, pciffopererlabiosimthto ^ 
prenant au moms un des gAnes precrtes dans une cellule hote au moyen du precede decrit dans EP564966. ledit pro- 
c6d6 6tant incorpcre par reference dans I'ensegnement de la presente invention. En resume, ce precede permet de 
pouvor (1) termer la cellule hdte avec un plasm.de dormeur qui ne sV reprtque pas. ledit plasmide oomprenant 
ledrt fragment place fonctionneltement (le cadre de lecture est conserve) dans une parte d'un cperen issu de la cellule 
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note; (2) identifier lee transformants ayant integre la totaiite du plasmide; (3) seleetionner des transformants ayart urU- 
quement intfigre dans le chromosome le fragment selon ("invention, fes autres sequences du plasmide s'etant excisees 
du chromosome; (4) et cuflfver les transformants sSectionnes darts des conditions appropriees pour la production rfun 
EPS* 

10050] On pent noter que ce procede permet de ne pas utiliser des sequences promotrice et Deactivation traduction- 
nelle fenctfonnelles. De plus, les concfiBons de culture appropriees pour la production d'EPS sort a ta portee de 
lnomme du metier, qui peut utiliser des mineux de culture standards, et choisir le pH, la temperature et radiation du 
milieu optimum selon la souche utilises. 

[00511 On peut aussi choisir de doner tout ou parte de la sequence SEQ 10 NO:1 comprenant au moins un des 
genes precites dans un plasmide d'expression autor epfcatrf en aval de sequences promotrice et cTactivaiion traduction- 
nelle fonctonnelles, et le cas echeant en amont d'un termlnateur. puis de transformer une cellule hflte par le plasmide 
recombinant 
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[0052] On peut aussi utiliser lee enzymes recombinees pour modifier ou synthetiser invHrow oligosaccharide ou un 
polysaccharide comma un EPS, par example. Pour ceta. ii est preferable de purifier au moins une de ces enzymes, en 
surexpnmart ctesskjuement leur gene dans une cellule, et en les isolant dassiquement, par precipitation et/ou chroma- 
tographie (du milieu de culture et/ou de la parte membranaire des cellules), par exempla 
[00531 Un autre objet de la presente invention concerne una cellule comprenant infegre dans son genome ou par le 
moyen tfun plasmide replicabfe. un AON reeombine selon hnvention. at exprimart une enzyme recombinee fonction- 
neile selon I invention. Cette cellule peut fairs parte du groupe des moisissures. des lavures, des bacteries et des plan- 
tes. par example. De preference, les levuras apparterment aux genres Sacchammyces, Kluyveromyces, Hansenula et 
Pictna : les bacteries sort Gram negative ou positive appartenart au genre Escherichia, Bacillus. Lactobacillus 
Laetomccus. Streptococcus et Staphylococcus ; les cellules de plartes apparterment aux legurruneuses, et aux espe^ 
ces cerealieres et ligneuses ; tandis que lea moisissures sort les cellules tradrtionnallement utiKseas pourpreiwerun 
toji comme les Aspergillus, Rhizopus et/bu Mucor. 

[0054] Un autre objet de ia presents invention concerne un precede de production d'un EPS. dans lequel (1) on done 
dans un vecteur un fragment cTADN codant pour au mdns I'une des enzymes selon Knverticn, ledft vecteur compre- 
nant ^ outre une sequence permettart la replication autonome ou rintecjation dans une cellule hots; (2) on transforms 
una cellule hote par ledrt vecteur. ladrte cellule note uflisant les enzymes codecs par le vecteur. le cas echeant en com- 
bmaison avectfautres enzymes praduites par la cellule hote si le vecteur n'apporte pastous les enzymes necessaires 
k labiosynthesed-unEPS, pour la otosyrthtee d'un EPS ; (3)pd$oncuttivelacdlutehotetransferrneedansdeB^ 
drbons appropriees pour la production d'un EPS. 
[0055] Stone met pas en oeuvrelepixiced6dec^ 

moms une sequence promotrice tonctiormelle et au moins une sequence (fadivation traductionnelie fbndionndle per- 
mettart rexpresaon des genes codant pour au moins I'une des enzymes seJon I'invention 
t0056] XJi U P r6seme in,dn6ot] e« decrite plus en detail d-apres a I'aide du complement da description qui va suMa 
qui se refere a des examples tf obtentkxi de fragments d'ADN, de plasmides recombinants et de bacteries transformees 
salon rmventon Ces examples sort precedes cTune description des rniDeux de culture. Uvadesoi, toutefbis, que ces 
examples sontdonnes a titre dWustraiion de I'objet da llnvertion dont ils ne constituent en aucune maniere una (irrita- 
tion. La manipulation de I'ADN. le donage et la transformation da cellules bacferiennes sort, en fabsence de precisions 
f?**?^ fl^* 5 86,00 les P^^es decrits dans Touvrage de Sambrook et al. (Molecular Cloning, A Laboratory 
Manual. Cold Spnng Harbor Laboratory Press. USA. 1989). Les poureertages sontdonnes en poidstodde, sauf indi- 
cation contraire. ^ ' 

MiHeux: (rajouter 1 .5% de Bacto-agar pour un milieu sdide) 
[0057] 



" nll^^i*****"?* 1 *' 8Oyt0ne 0,S% ' viflftde W«*&6 0,5%. extrait de levure 0,25%. adde ascorbique 
0.05%. sulphate de magnesium 0,025%. disodium-bela-glycerophosphate 1 ,9% et de Peau 
so - LM17:milieuM17cornprenarti%delactosa 

• GM17: milieu M17 comprenant 1% de glucose. 

- MSK: lait 6crem6 (poudre reconstitu6e a 10%) comprenant 0,1%<fextraitde levure 

• LB: tryptone 0.5% extrait de levure 0.25%, et NaC1 1%. 
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Exemplel donage de roperon de L bulgarfcus CNCM l-SOO implique dans la synth&e dun EPS 
[0058] 

1,1. Structure rSptoede 1'EPS : la structure de J'EPS pnoduh par la souche L bulgaricus Lfi5 (CNCM 1-800) a to 
dtormin6e par r6sonnance magn&ique, selon una technique similaire d celles d6criies dans EP 97111379.0 et 
EP 971 1 1381.6. LfiS r&ultats montrent que I'EPS est constitue de runit6 repetitive suhrante: 



(M>Galp a-L-Rhap p-D-Galp 

I 1 1 

I I I 

4 3 3 

^3)-^D^a!rtI^)^-I>^^ 



1.2, Storage; 

L'approche teniae afin dlsofer les g£nes eps de la souche Ui5 est bas6e sur la compamison de g&nes eps 
connus (ceux de S. thermophitus) at de leurs hcmologues (genes eps, /fl>) cfespdces varices, et mflma 
d'espfcces non-apparentees phylogWquement. comme des esptees Gran>n6gatif. Ces comparaisons permettent 
afnsi de dginir des regions conserv6es entre tes espfcces, et tfutiliser des amorces nuc!6otidiques d^rvfes de ces 
regions conserv6es atin d'anplifier par PGR una parte interne de I'operon eps de la souche Lf& Cette approche 
s'est malfteureusement heurt6e d una impossfcilite danpfff ier un g6ne eps, quel que sort les amorces choteie& 
Les rafsons ayant conduit 6 ces tehees peuvent fitre multiples, par example Ii6es a una faible homdogie entre les 
gSnes eps de la souche US et ceux des regions conserves, ou a das conditions de PCR inadequate^, etc 

Race a ces echecs, on a dWd§ de seiecfionner. puis tfutiJIser dans une PCR. des amorces nud eotidiques par- 
ticuJferement deg4ntoes. Le choix de ces amorces spteifiques a en fait 616 determinant pour I'arnpBfication (fun 
g*ne eps de la souche Lfi5, eta to motive par les considerations suwantes: (1) la selection (Tune fonction enzy- 
matique retrouvfie souvem tors de la btosynth6se (fun EPS ; (2) la selection de sequences nucieotictiques conser- 
ves en comparant des genes de diverges bacttries codant pour cette fonction enzymatique; (3) la selection de 
sequences conserves dont le Cfcntenu en nud bolides GC so rapproche le plus possible de I'organisme cUe. 
mfime si pour ceta on dot prendre comme point de ctipart de la selection des sequences nucieotkfiques retrou- 
v6es dans des organismes Eloign 6s phytog6niquement de I'organisme rihie (£ coil) ; (4) Identification tfuna par- 
tie dans les sequences con$erv6es qui est natureflement plus riche en nucleotides GC ; (5) Identification d'une 
parte dans les sequences conservdes qui est peu d6g6n6r6e, tfest-frdire codant pour des addes anin6s qui sont 
eux-mfimes codes nalurellement par 1 ou 2 codons, tel que la methionine, le tryptophane, la glutamine ou Tacide 
glutamique, par exemple ; etc. 

Parrrt les amorces testes, celles ayant les sequences nudeoticfiques SEQ ID NO: 11 et SEQ ID N0:12, ont per- 
mis d'ampfifier un fragment de g&ne eps dans les conditions de PCR suivanles: successivement 2 mini 95 B C, 1 
min a 42*C, 20 s k 72°C. puis 35 Ibis de suite la cycle de 30 s a 94°C, 1 min A 42°C at 20 s & 72°C. Pour cela, I'ADN 
g6nomique de la souche Sfi39 a to au pf Salable isoJ6e selon la technique de Slos etaf. (Appl. Environ. Microbiol.. 
57, 1333-1339. 1991). On utilise environ 100 ng d'ADN g6nomique et la Taq polymerase. 

Un fragment de PCR de 143 pb a amsi pu Stre isdd, puis done dans le plasmide linearise pGEMT (Prt>mega, 
USA). Le s4quencage de ce fragment par la methods des did6axynud£otides (Wt f-mol® DNA Sequencing Sys- 
tem, Promega) indique une sequence correspondant aux nucleotides 1698 & 1841 de la sequence SEQ ID NO:1. 

Ce fragment de PCR a to utilise pour cnWer una banque X-ZAP Express (Stratagene. USA) renfermant des 
fragments d'ADN de la souche Lfi5. Pour cela, selon les recommandations du foumisseur on dig6re partiellement 
una preparation d'ADN dudit mutant par SaudA, on s6pare les fragments par une 6lectrophorfese sur gel d'aga- 
rose, on coupe du gel les bandes correspondants & des fragments de 5 k I2kb. on 4ue I'ADN, puis on le Dgue au 
vecteur X-ZAP Express pr6alablement dig6r6 par SamHI. On encapslde in-vitro le produft de ligation & Taide du 
systdme GigagoWIII (Stratagene). on melange ensuite las phages avec des Escherichia coii XL1 Blue (Sfratagene) 
selon les recommandations du fournisseur, puis on etate le melange sur bolte de Petri. On analyse ensuite les pla- 
ques recombinants par hybridation de leur ADN transtere sur una membrane Hybond-N (Amersham Ufe Scien- 
ces. UK) avec le fragment da PCR pr6alab!ement rendu radioactif (lot Random Primed DNA Labeling, Boehringer* 
Manheim). 
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Parmj les nombreuses plaques recombinantes, on a pu B^lectionner par hybridation plusJeurs plaques positi- 
ves, desquelies on a ensure isoid les vecteurs X-2AP Express, puis excise las vecteure pBK-pCMV (pCMV) ren- 
fermant J'insert cHromosomique (voir les recommandations du foumisseur Stratagene). On a ensuite sequence les 
inserts chromosomiques de ces vecteurs pCMV (kit f-mol® DNA Sequencing System). On a pu ainsi caract6riser 
une sequence de 6 kb correspondent k I'operon de la souche LfiS impfique dans la synthase d'un EPS. 

ATin de r6cup6rer les sequences bordant le fragment initial de 6 kb, cfautres cribtages de la barque Lambda 
Zap ont 6t6 affectum mala aucun n'a par mis dlsoler de nouveaux fragments- Certaines sequences de Lb. 
bufgaricus contenant par exemple des promoters sont connues pour fitre toxiques et done instabtes chez £ coti. 
Cela oxpfique sQrement lee difficult^ k ieoler les fragments d'ADN adjacents. Afin de contoumer cat obstacle et 
de doner les regions d'ADN bordant ce clone, les techniques de PGR reverse et de SSP-PCR (Single Specific Pri- 
mer PCR) ont 6t6 utilisees. Cela a permis <f amplifier plu&ieurs fragments correspondent aux extremites 5* et 3' de 
I'op^fon eps. En recoupant les sequences nucI6'ques des dtfffrents fragments chromosomiques rsofes, on a pu 
ainsi caracteriser une sequence de 9,2 kb (voir la figure 1). La sequence nucieotkfique de ce fragment de 92 W) 
est representee dans la sequence SEQ ID NO:1 ci-apres. 

I.3. Analyse de la sequence SEQ ID NO: 1: la sequence SEQ ID NO:1 pr6sente top£ron eps de la souche Lfi5. 
Cette sequence ccmprend 9 ORFs complete, dans la mfime orientation, que Ton appefle ep$1, ep$2, ep$3, eps4, 
eps5 t eps6, eps7, eps8 et eps9 (voir la figure 1). La comparaison des sequences en atides aminfe codees par les 
ORFs avec celles de profanes pr6sentes dans la banque de donr^e Swiss-Prat, k Taide des bgiciels PASTA. 
PEPPLOT et PILEUP da GCG^oftwear, Wisconsin, USA, permet de ttome la fonction de ces prolines. Les 
rteultats sont present6s ci-aprd& 

[0059] L'ORF ep$l (nucleotides 1323-1982) code pour une proteine (SEQ ID N02) ayant environ 45% dldentitf 
avec la proteine Cps14E de Streptococcus pneumaniae (Genbank, n°P72513). Cat ORF code ainsi de toute evidence 
ss pour une galactosyl- ou glucosyl-phospho-transferase catalysant le transfert du premier suae but le transporteur Dpi- 
dique ou pratique. 

[0060] L'ORF eps2 (nucleotides 2074-3174) code pour une proteine (SEQ ID NO:3) ayant environ 30% dldentitd 
avec la proteine EpsF de Streptococcus thermophilus (Genbank, n°Q56043). Cat ORF code ainsi de toute evidence 
pour une alpha-glycosyftransffrase. 
90 [0061] L'ORF ep$3 (nucleotides 3246-4373) code pour une proteine (SEQ ID N0:4) eyant environ 34% dldentite 
avec la proteine EpsQ de Streptococcus thermophilus (Genbank, n°Q56044). Get ORF code ainsi de toute evidence 
pour une afpha-glycosyttransterase. 

[0062] LORF ep$4 (nud6ofcies 451 1-5317) code pour une proteine (SEQ ID NO:5) ayant environ 7% dldentite avec 
la profane YveO de Bacillus subtills (Genbank, n°P7lQ54). Cet ORF code ainsi de toute evidence pour une beta-giy- 
35 cosyftransf 6ras& 

[0063] L'ORF ep$5 (nucleotides 5335-6204) code pour une proteine (SEQ ID NOS) ayant environ 30% dldentite 
avec ia proteine CpsHK de & pneumaniae (Genbank, n°O07341). Cet ORF code ainsi de toute evidence pour une 
glycosyttransferase. 

[0064] L'ORF eps6 (nucleotides 6709-7692) code pour une proteine (SEQ ID NO:7) ayant environ 33% dldentite 
40 avec la proteine Eps I de £ thermophilus (GenBank n*QS6046). Cet ORF code ainsi de toute evidence pour une beta- 
glycosyttransferase. 

[0065] L'ORF eps7 (nucleotides 9-353) code pour une proteine (SEQ ID NO:8) ayant environ 38% d'/dentW avec ta 
proteine EpsB Lactococcus lactis (GenBank n°O06030), Cet ORF code ainsi pmbaWement pour une prot6ine de regu* 
lafon impRquee dans le contrdle du poicte moiecufaire et/bu la tongeur de la chaJne polysaccharidique. 
46 [0066] L'ORF epsd (nudeotides 516-1292) code pour une proteine (SEQ ID NO:9) ayant environ 38% dldentite avec 
la proteine EpsC Lactococcus lactis (GenBank n*O06031). Cette homologie confirme le rOle de cet ORF dans la syn- 
thase d'un EPS. 

[0067] L'ORF eps9 (nucleotides 7723-8784) code pour une proteine (SEQ ID NO:10) ayant environ 24% d'tdenth* 
avec la proteine YveQ Bacillus subtilus (GenBank n*P71056). Cet ORF coda ainsi probablement pour une proteine 
so reportable de la polymerisation des urates repetees. 

[0068] En conclusion, les homologies observees indiquent que les different* ORFs identifies dans les inserts chro- 
mosomiques sont impliques dans la biosynthese de TEPS. 

Exemola II Biosvnth6sed'un EPS 

55 

[0069] On prepare un plasmide k partir du plasmide pSA3 (Dao et a/., Appi. Environ. Microbiol., 49, 1 15-1 19, 1985), 
en ajoutant un fragment cfADN de la souche U IS contenant la sequence de 9,2 kb ddcrite k Texemple I (voir la liste de 
sequence), et en ajoutant les parties r6guJatrices de I'operon eps de la souche S. thermophilus Sft6 (EP750043), de 
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sorte que I'expression Pa transcription et la traduction) des gfcnes eps de la souche Li is puisse fetre effective dans 5. 
thermophilus. On transform© ensuite par 61ectroporation, avec ce piasmide, la souche S. thermophilus CNCM M422 
qui a 6t6 d6pos6e le 18 mai 1994 selon ie traits de Budapest Nlmporte qu'elle autre souche filante S. thermophilus 
auraft pu aussi Stre ut2i$6e. Cette souche prfeente au microscope un aspect de coques non flageitees formant des 
5 chaTnettes, eile ne fait pas de spores, eile est anatorobe facultative, et efie produit un EPS ayant la composition 
Glc.-Gal=22. 

Exemple l[[ Biosvnthese d*un EPS 

10 [0070] On prepare un piasmide k partir du piasmide pSA3, en ajoutant un fragment d'ADN de la souche LfiS conte- 
nant la sequence de 9.4 kb dtaite k rexemple I (voir la liste de sequence), et en ajoutant les parties r^gulatrfces de 
Top&non ep$ de la souche $. thermophilus Sfi6 (EP750043), de sorte que I'expression (la transcription et la traduction) 
des g&ies eps de ia souche LfiS puisse Gtre eftectuee dans & thermophilus. On transforme ensuite par 3ectropora- 
tior?. avec ce piasmide, la souche S thermophilus CNCM 1-1351 qui a 6t6 d6pos6e le 5 aout 1993 selon le trait 6 de 

15 Budapest. N'irrporte qu'elle autre souche filante & thermophilus aurart pu aussi dtre utilfe6e Cette souche presente 
au microscope un aspect de coques non flagellees formant des chaTnettes, eile ne fait pas de spores, alia est anae- 
robe facultative, et eile produit un EPS ayant la composition Gc;Gal:Rha=1:3:2. 

Example IV B*p$ynthfrge <Tun EP$ 

so 

[0071] On "sole de I'ADN chromosomique de la souche CNCM I-600, on digfee la preparation d'ADN par Xba\, on 
s6pare fe$ fragments cfADN par Gectrophorase but gel d'agarose 0,7%. on 61ue les fragments de pJu$ de 9 kb, on ligue 
I'ADN extra It au vecteur pJIM2279 (obtenu de P. Renault. INRA. Jouy-en-Josaa, Paris, France) prfelabtement tfggn2 
par Xba\ puis dfiphosphoryte. On transforme la souche Uctococcus lactis MG1363 (J. Bacterid., 154. 1-9. 1983), cul- 
2s tfv6e sur milieu GM17 k 30°C, par la m&hode de De Vbe era/. (Gene. 35. 169-176, 1989). On s6lect»nne les clones 
transform^ par hybridation de CDNA gdncmique des cfones avec rune des sondes d€riv£es de la sequence SEQ ID 
NO:1 

Exemple V Preparation de afenos fanc ^n^s rwrnoloaues aux qftnas eo$1-9 

so 

[0072] On prepare des d6nV6s fonctiormete des gfcnes eps1-9en mettarrt en oeuvre une mfthode adaptte de celle 
d6crite par Adams et a/. (EP402450; Genencor). Pour cda, on isole chacun des gdnes eps par PGR k partir de I'ADN 
gtaornjque de la souche LfiS (CNCM 1400). Les amorces utilisdes sent choisies k parttr de la sequence SEQ ID NO: 1 , 
de sorte k amplifier uniquement chaque gdna On clone chaque produit de PCR dans le vecteur d'expression pQE60 
55 (Qiagen, US) tonctf onnellemerrt en aval dim promoteur £ coti rdgulant la transcription et la traduction du gfcne eps. On 
soumet enfm chaque vecteur k une mutag6n&se chimique in-vitro avec de I'hydroxyiamine, comme d6crtt par Adams 
etaL 

[0073] On transforme la souche £. coif DH5a (Stratagen, US) qui ne possfcte pas naturellement cfactrvrte glycos/1- 
transf&Bse, par las plasmides pQE60 trartfe avec regent mutagfene, puis on s#ectionne des transformants. 
40 [0074] Pour identifier parmi les transformants des gdnes eps codant pour des variants d'enzymes, on analyse la sp£- 
cifidt6 enzyrnatique des enzymes exprimGes dans chaque clone d'Ecotf, au moyen do la mdthode dtorte k rexemple 
VI. L'analyse des g&nes eps portes sur les plasmides pQE60 des dones ainsi s^ectionnes montre que ceux-ci ne dif- 
ferent du gdne eps original que par la substitution, la d^ion ou ('addition d'un petit nornbre de bases rxtd&tidiques 
conduisant k des modifications de la sequence en addes amines de la g!ycosytoransf6ra$e. 

4S 

Example VI Synthase de polvsacehariri^ avac [&$ gly ^Hrarisffrasefi de Lffi 

[0075] On isoie chacun des gdnes eps codant pour une giycosyJtransterase par PCR k partir da I'ADN g$nomique 
de la souche US (CNCM 1-800). Les amorces utifis6es sont choisies k partir de la sequence SEQ ID NO:1 , de sorte k 

so amplifier uniquement chaque g£n* On clone chaque produit de PCR dans un vecteur d'expression pQE60 (Qiagen, 
US). Les vecteure ainsi trait6s sont ensurte introduits dans la souche E. coti DH5a. On curtive les souches DH5a trans- 
fbrm^es dans du milieu LB contenant de rampicilline jusqu'^l une DOgo 0 de 0,8, on ajoute au milieu de culture 1 mM 
dIPTG, on incube les cellules pendant 2 h, on centrifuge Fes cellules k 6000 g pendant 10 min k 4*0. on les lave dans 
le tampon A (50 mM de Tris-ac&ate pH8, 1 mM de DTT, 1 mM d'EDTA et 10% de glycerol), on les centrifuge k nouveau. 

55 on re-$u$pend les cellules dans le tampon A contenant en outre 1 mM de PMSF (f luorure de ph^nyimfthane sulfonyle) 
et on soumet fa suspension k 15000 psi. On limine les cellules entires par centrifugation k 6000 g pendant 1 5 min 4 
4°C. on r€cup6re les membranes cellulaires du surnageant par uitracentrifugation k 100000 g pendant 1 h, et re-sus- 
pend I'aliquot dans le tampon A. Ce protocols permet ainsi g6n6ralement cTobtenir environ 10 mgAnl de |^ot6ines. 
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[0076] Parail&lement. on cuftive la souche Lfi5 dans un milieu contenant du D-Glcp, D-Gaip et L-Rhap, on soumet 
les cellules do cette culture d 20000 psi, on extrait des membranes les chines saccharidiques en formation 0i6es k 
une amorce) en trafent les d$bris ceUufaires avec du chloroforme/m6thanol (2:1) at en 6vaporant I'eodrait A trtre de 
t6mo!n dans les essafe qui vont suivre. on precede de la mfime manifcre avec 2a souche Lfi5 cuftiv£e en presence de 
sucres racfoactif* 

[0077] On dftermine ensuite fa sp6crf«crt<§ des glycosyHransf^rases pr6sentes dans Ids membranes par un proc&te 
simiiajre k cakri d&rit par Kblkman etat. (Mol. Microbiol-, 2& 197-208, 1097), FV)urcela, on fart r6agir pendant 2 h 4 dans 
un volume rtocfonnel de 150 uJ, 100 pi (environ 1 mg) de membranes, 50 mM de Tris-ac&ate pH8 10 mM de MgCl* 
imM d'EDTA. 1 ui (environ 25 nCQ tfUDPHO-Opp, d'UDPl 1 ^K3alp ou de TDpI 14C )-Rhap selon'la glycosyltransfl 
rase con$id6r6e, et le ddpfit contenant les chalnes saccharidiques en formation non-marquees iso!6es de la souche 
LfiS (voir le paragraphe ci-dessus). Pour arrSter la reaction, on ajoute au volume rtectkxinel 2 ml de chtoro- 
forme:m6thanol (2:1). on agite vigoureusement le melange, et on le laisse reposer pendant 30 min On limine les 
sucres nud&rtidiques en extrayant fa phase organique 3 fois de suite dans 0.4 ml de PSUP (pour 1 litre: 15 ml de chlo- 
roforms. 250 ml de methanol. 1 .83 g de Kd et 235 ml tfeau). La phase inf&ieure contenant toutes les chaines saccha- 
ridiques OSes * une amorce est ensufte s6ch6e sous vide, resuspendue dans 200 uJ de 1 -butanof et s6par6e dans deux 
tubes. 

[0078J Dans la premise s6rie de tubes, on ddtache les oligosaccharides de leur amorce en effectual* una hydrolyse 
douce dans 50 mM de TFA (ac. triffuoroac&ique) k 90°C pendant 20 min. 

[0079] Dans (a deuxfeme s6rie de tubes, on soumet les oligosaccharides d une hydrolyse pous$$e dans une solution 

so de 4M TFA pendant 1 h h 125°C 

[0080] On sdche ensuite les hydrolysaJs et on les resuspend dans 5 ml de sucres transporteurs dans 40% dlsopropa- 
nol (5 mg/mJ de cheque Sucre suivant: Gfc. Gal, GalN. maltose, maltotriose, maltotetraose). Les sucres hydrolysdes de 
chaque s6rie de tubes sont afore d6pos6s sur une plaque HPTLCsaicagel 60 (Merck) que Ton soumet d un Ouant com- 
pos* de chloroform* tf actde acetlque et cfeau (respectivement 6:7:1 ). On autoradiographic ensuite la plaque pendant 

25 1 6 a 24 h avec un film Komax MS (Kodak). On visualise les sucres transporteure en cfiffusant sur fa plaque une solution 
d'&hand compliant 5% dUgSO* et en chauffant la plaque & 10o°C pendant 15 min. L'anafyse des plaques permet 
ensuite (Identification precise des foncbons enzymatiques cod&* par les gfcnes epsdefa souche Uf5 
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LISTS DE SEQUENCES 



5 {1} INFORMATIONS GENERALES: 

(i) DEFOSANT: 

(A) UOM; 30CIETE DBS PRODUCTS NESTLE 

(B) RUE: 55 AVENUE NESTLE 

(C) V1LLE; vbvey 

(D) ETAT OU PROVINCE: VAUD 
10 <E) PAYS: SUISSE 

(p) CODE POSTAL: 1500 
(ii) TXTRB DE L' INVENTION: BACTERIES LACTIQUSS PRODUISANT DES 
EXOPOLYSACCHARIDES 
(iii) NOMBRE SB SEQUENCES: 12 
(iv) POUHE DECHIFFRABLS PAR ORDINATEUR: 
(A) TYPE DE SUPPORT: Floppy disk 
15 (B) ORDINATEUR: IBM PC compatible 

<C> SYSTEMS D* EXPLOITATION: PC-DOS/MS-DOS 

(D) LOOICIBL: Patentln Release #1.0* Version #X.30 (OES) 



(2) INFORMATIONS POUR LA SEQ ID NO? 1: 
(i) CARACTERI3TIQUES DE LA SEQUENCE -- 

(A) LONQtiBUR: 9217 paires da bases 
(8) TYPE: nucleotide 

(C) NOMBRE DE BR INS; double 

(D) CONPICURATION: Uneaire 

25 (ii) TYPE DE MOLECULE: ADN (genotnique) 

(XX) CARACT3SRISTIQUE ; 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT; 1323 . r 19B 2 

(D) AUTRES INFORMATIONS : /product* "eepi" 
(ix) CARACTERISTIQUE: 

(A) NOM/CX£: CDS 
30 (B) EMPLACEMEIIT:2074^3174 

(D) AUTRES INFORMATIONS: /product- *eps2* 
(ix) CARACTHHSTXQUEs 

(A) NOM/CLB: CDS 

(B) EMPLACBMENT:324S..4373 

(D) AUTRES INFORMATIONS: /product- »eps3" 
55 (ix) CARACTERISTIQUEs 

(A) HON/CLE: CDS 

(B) EKPLACEMENT:451X.-5U7 

(D) AUTRES INFORMATIONS : /product* "eps4" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: S3 35.. 62 04 

40 (D) AUTRES INFORMATIONS: /products "eps5" 

(ix) CARACTERl STIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 6709,. 7S92 

(D) AUTRES INFORMATIONS: /product a "epafi" 
(ix) CARACTERl STIQUE: 
4« (A) NOM/CLE: CDS 

(B) EMPLACEMENT : 9. . 353 

(D) AUTRES INFORMATIONS :/produet= *ep67* 
(ix) CARACTERl ST I QUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT : 5 W. .1292 

(D) AUTRES INFORMATIONS: /product- "epsS" 
50 (ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 7723.. 8784 

(U) AUTRES INFORMATIONS : /product^ H eps9* 
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(xi) DESCRIPTION PB LA SEQUENCE: SEQ ID NO: li 
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GGCCAACTAT 
CTAGCCGGTC 
TGTCAATCTT 

atatgttgga 

CACCGATCTT 
TGGTTGTGCG 
AAGCTGAjCTA 
GAGACGGCTA 
AGAAGAAGGG 
ACATCTTACC 
GAGCCCCGGT 
GCTACACCAA 
ACCAAGCGGG 
f AACTGAAGC 
TCTTGGAAXT 
CCAGAAGAGG 
ATCCGCAGAA 
CATATACCOG 
GACAATGTGC 
QTGAAOCACT 
ATAACGCOCA 
AGAA6CQCAA 
AAATQGATAT 
GTCCTCTCTA 
TTCTATTGTC 
CAGTCTTTTA 
TTOQQTCCAT 
TCGAAGGGOC 
TCAGAGCACA 
CACTGGTGGG 
AGCAGAGATT 
C GGCTG ATTT 
TCTTTGATCT 
AGAT6TATGA 
TTCAAGAGCG 
CTCTACTTCG 
AGCCTAGTQG 
AATTATCGAG 
AGTACTAGCA 
ATTCOOCCAG 
TTTAACACAA 
GGCGAGAGTA 
CAACCAACGA 
CATCCCGTGG 
ACGGACGCTT 
AAGAATCCAA 
ATTGGCGATG 
TTAACGCGTC 
CTGTGCGAAC 
GTCAOTQATG 
CAGACCGTTA 
ATTGATTGTG 
T ATSAT CAAC 
AATTTTACTG 
ATCTTATGCA 
ACTTGTATGC 
CCCACCACTA 
TGGCTCACGC 
TTACACAGAT 
GAATTGCTTT 
ACATGGCTCA 
CCTTTACTAA 
ATATTTGCTC 
ATAAGGTGCA 
GACAAATTGG 



GCACTCTAYT 
TATGGAAATG 
GACGGCAGST 
TTTGATTGAA 
GGACGCGGGC 
CCAGTCATAT 
AGTCACCAAT 
tGGATACGGG 
GCTCTTTGGG 
AJGGAATC6AC 
TGCGGATGGC 
CCACAAGCAA 
TATTCCGCTG 
TCTTGACAAT 
GCCAAGCAAT 
GATTACGCCA 
GTTGCAAGAA 
CTTGTTTGGC 

cttcvttgcc 

GGATAAOTTG 
AGOSGTAATC 
GAAGTTCTTA 
GGGATATAGC 
CCAT GGGATC 
GCCACTTTTT 
CTCACAAATC 
GGTGGTCAAT 
CATGTTTAAG 
CAGCTTGGAT 

gcctcggcca 

GCTCCTAAAA 
TGCGGATATG 
GTCGATCATT 
GGAGAATGAC 
AATGATTATA 
TCGAACCGAT 
ATGATTGGGA 
AGTATTTCGA 
T CACGA AAQC 
ATGTTATTCA 
AGAAAACGCC 
GCAAGAAACG 
CCATTGCATC 
AAGTTGATAA 
CGAAGATTGA 
ATGTTTTCAA 
GTOAATTACG 
ATGAGGCGTT 
GGTTACCGAT 
TCATCGGTAA 
ATGATTTTTA 
CTTA7AAAGA 
TTTATCAAOC 
AATAGTATCT 
GAAAATACGT 
ACTGTTGAAG 
TGAGATGGGC 
AGCTTGTTTC 
CAAGCCAGAT 
GATGGGGATG 
GTCCAAGAAG 
AAAAGTTGTC 
AAAGGATAAA 
ACCTGTTACT 
GCGCCTTAGT 



TTCAATGTAT 
GACGCAAACA 
CCAATTCCCC 
GATTTAAAGC 
GAAACCCAGC 
TCACAGAAGT 
TTTAGGTTAT 
TABGGCTATG 
AGAAAGAAGT 
GATGGTTCAA 
GTAACCCATG 
QAT CTGATCA 
ACGGTCTTTC 
GATGACATCC 
GAAGTGCCAC 
ATCgTTGTfC 
TTCTTGOAAA 
AAAGAAATCG 
AGTOATGCTC 
GCGAAAOAAT 
AATOGCGATC 
GGTCTGTTTT 
AGTAGTCCAG 
AA6CGTCTCT 
TTGTGGCTGG 
AOAATTGCCA 
GCTGAGAAGC 
ATOCATGATG 
GAATTGCCTC 
CCGTTGCCAA 
CCAGGCTGCA 
GTGCAGCTCG 
TTCAAGACAA 
GAATAAJGCTA 
GGGTTACGTA 
G GGCG GCCGG 
TGTTTATAtt 
TGAACGAGTG 
AATCAAAGCA 
TCTACATTCT 
GGTCTTTTAT 
CTTGGCGTAT 
TAGCCCTGGT 
TGGTATCAAC 
TCATTATGAC 
TGAGGTCGCA 
TTCAGAGCTA 
AAAGTACTCA 
6AGCTTGTTG 
CCATGATGTA 
T AATAG AATA 
TGTTTTAGAA 
A QCAA TCAAO 
GCTTCATTAA 
GTTGTTCATG 
AACAGTGATT 
AAGTTTAAAA 
AAAAATGATA 
ATCGTCTATG 
CATATACCAG 
AAAGAACTGG 
TGTATTTCGG 
ATCAAAATTA 
CGGAGAGATC 
GAGCAGAAAT 



CCAANNGCAA 
GCGTGATCCG 
CAAACCCATC 
AAOAATATGA 
AACTGACCAG 
CAGCGGTTAA 
GTTATGAACG 
GTTAGGGCTA 
AGCTCATGCC 
AGTCTTGGGA 
CCTTGTGTAC 
AGTTGACGGA 
CAGOACATGA 
TCTTCTGCGA 
ATTACACCAA 
ACCCAGAACG 
TGOOAGTTTT 
AAGACTGCAG 
ATGATTTGCC 
TTGGTGAAGA 
CGGTTTACTT 
AAAGTGGAAA 
CATATGTTAA 
TTGACTTTCT 
CAATCAAGAT 
AGGATGAAAA 
TGAAGAAGGA 
ACCCGCGGAT 
AGCTTTGGAA 
ATGAG GTTQ A 
GTGGCCTTTG 
ACATCGAGTA 
TCGGTGTTAT 
TATGGAAAAG 
CATATGAAAQ 
GTTTTTACAT 
GGTTATGCTA 
CATCTAATCG 
GGACAAGAGA 
AGTATTGCAG 
ACTCCACATG 
AAGTTGGTAG 
GAGTATCAAG 
ATTCAACAAT 
GTTTTTACAC 
TTGAAGTTGT 
ACTGCTCCGA 
CTTAATAGTG 
OAAGCAATGT 
ATCAATGATG 
TCAATGATCG 
CGCTACAATA 
AATAGTGAGT 
GTTATCTTCC 
TGGCTGAAGC 
CTCAGAAGAT 
AATATGTTTC 
AAGCTACAGT 
CACATTCAAC 
TAATCTATAA 
CTTACAGGCT 
AAGCAGAGAT 
TTCCCAATGG 
TTGGTATTCT 
CCCCAGATGT 



CSGCTTGACC 
GGAAAGTGGT 
AJ3AACTTCTC 
TATGGTCGTG 
TTCTTTGGAC 
GCGGGGCAG7 
ATGTTGATGC 
CGGATATGGC 
GGTAGTTGAT 
GGCTTCACTT 
TCCACACACA 
AGAGTTTCAA 
AGTCAGATTG 
TGAAGAGGGA 
GAACATGGTG 
GAATAAAAAA 
GGTACAGATC 
CCGGGAGTTT 
AAGACGGCAA 
TAAGAAACAG 
GAACTGGCAA 
TTTGGATGAA 
ACAGTCCAAA 
GGCTTCTTCA 
TCATQGTGAA 
6CCTTTCCCG 
TCTGCTGGAG 
CACTAAGATT 
T6TGCTGATT 
ACAGTATACT 
GCAAGCAACT 
CATTAATCCG 
GTTCCACCCG 
TGGCTAAGCA 
GAAATAATAA 
ATATTGTTGA 
TGCGCAACCA 
AGGTTAAGAA 
TGAAAAGGAt 
GAGCAATTGC 
GTTACAfiCTT 
AGCAGll k'TG 
AAGCTTTAAA 
TGCAAGAATT 
TGGGCCGTAT 
CGAATT TAAA 
ATATTAC1CT 
ATACTTTTAT 
ACATOAAGAA 
GTGTTAATGG 
GGGOGGCTCG 
CTAAAGTAGT 
GTTTCTGTCT 
AATCAATCTC 
TGCAGCTQGA 
AGAGAACTAC 
TCGTGAATAC 
TAAGCAGATT 
TAAAGCTGGA 
TCCCCATGGT 
GATTGAGAAG 
GCAGTCQGCG 
TATTGATTTT 
CGAAGACGCA 
C 1 rTGTTGAA 



ACTTTGTTGA 
GTAGAGAACC 
TCTTCCAAGC 
CTTGACTTAG 
GGGACGATCT 
TGAGCTACTT 
CGATGGGGAT 
GAAGAAGAGG 
TTACATTGTC 
AAGCTCGCTA 
TTAAATGGCC 
GACCGGATTG 
TCAGGTGGCT 
CACTACATGC 
TACGAACTGA 
ATTCTGGCAA 
ACTGCCAGCT 
ATCAAGGCTG 
TATCA ACTG A 
AAGTATTTAG 
CCTTTACCGA 
GGGGAGGAAA 
OTCAA OggC C 
ATTGCCTTGA 
GACGCCGGAC 
ATCTACAACT 
CAAAATOAAG 
GGCAAGTTCA 
GGGAATATGT 
GACTATGACA 
AGCCGGAATG 
AGTGCSCGTCT 
AACGGGATGT 
CT T0 7T G TTC 
ACCTCGCCTG 
TCTAGCAAAT 
AACACCTCAA 
TTTTGCTCGT 
AGCAAAGGCT 
ACGT GTCGTC 
CTTAATGCAA 
CGGCAAOAOC 
AGTCTCTAAA 
GATAGACACG 
C TCAGT ACAG 
ATTTTTGTGG 
TACCOGTTGO 
GCTTACCTCA 
ATTATGTGTG 
GTATGTATGT 
CTATTCTCTG 
GTCTAAAGCC 
ATAAACTTTA 
TGCQ AGAAAA 
GTTGAAAGAT 
CTTATAGCTT 
CAACTTCAAA 
AAAAAAACAfl 
GCGCTTACTA 
TGGGCATTCA 

gttcaaattc 
atgcaaaaac 
gatttattgg 
tttgttgtgg 
atggcggaga 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1330 
1440 
1$00 
XS60 
1620 
1680 
1740 
1800 
I860 
1920 
1980 
2040 
2100 
2U0 
2220 
22B0 
2340 
2400 
2460 
2S20 
2S60 
3640 
2700 
2760 
2B20 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
390O 
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AAATCAAGAA AGAAATACCA AATTCGTTCT TCGTGATGGT TGGTGATGGC AACCTTGAAG 
CTGAGATTCG TAGATTAATT AAATCOAAAG GTTTAGAGGA TfCTTTCTTG ATCftCTGGAT 
GGGTTGATAA CCCGACCGGT TATTTAAATT GTTTCGATGT ATCAACGCTT CTGTCGAGAT 
GOGAAGOCTT TQGCTTOCCC TTAGTCGAAT ATATOTATTC COGTCtGCCA TTAOTTTCAA 
CCAAOQTTGA TGCTATCCCA TACGTAGTTG ATGATGGCGT TGACGGGTTA TTGGTTGAAC 
CCGATAACCC ATATGAGGCG GCTAAGGCTG TAATCCGCAT TCACGAAGAT CCTGCTTTAG 
CAGCCAAAtT TGTGGCTAAT GGTTTGAGTA TTGCGAAAGA TAAGTACGAC GTTCGCCGAG 
T CGCCA AACA AACACTGAAA TTAtACTATA AA G TTTTGCA CAACTTAAAA TGAAGTGCAT 
AATTTGCGTT GTATATTTAT ACQTAACCGA TAATGCGTTA AATACAAATG GTGTTGGGAA 

agcatctgaa agttgtatag tttatagtgt tgaatagcta aattaaaatt agataattag 
gagcaagcct atgccaaaag tttcagtgat tatgtctata tataattgca aoaactataa 

AGCCTTAGAO AAGAGTATTG AATCAATTAT TGATCAGACC tACTCTGACT GGGAGTTTAT 
CATCTATAAT GATGGGTCGC AAGACGATCG TAAGACCTCA GAQTATCTCA AGAAATTOOG 
TAAACOTOAT TCAAGGATCC AAATCATTGA TTGTCCGAAT AAJCATGGtT TOGCATATQC 
AAAGAATGAA ATOATCAAGG TCGCAAGAGG AGATTATATC ACAGCTCAOO ATGATGAlTSA 
TG TTTCGCAt CCTATGCGTT TGGCCCGAGA AGTAflACTTC TTAAATAGGC ACCCAGAGTA 
TGCCTTTCTT GGTACTGTTG CGAAACTTTT TGATAATAGT GGtAOGTOGO GACACTATGG 
ATTGAMGAG AAACCAACTA AGAATACTTT TTTATGGAAT AGTCCATTTC TTCACCCAtC 
TGTGATGTTT AGACATOAAG TGTTAGATCA AGTTAATGGG TACCGTGTTG CCAAGGATAC 
TATGCGTGCA GAAGATTATG ATCTATTCTT CAGACTGTAT GCTAAAGGTT ACAAAGGATA 
TAATATTCAG CAGGATTTAT ACGAATATAC GAtTGAAAAT AATCCAAATA ACAAATAtAG 
SCQ gATG ACT GACCGTATTC AAGAAGCAM GGTTCGATAT AAGGGGTTTA ACT CTTTTO G 
CATGTTAACG AAGGGGATTC CGTATATTAT TAAGCCCATC TTAATTGGAT TAA1TCCGCA 
GAAGATATTT TAT ATAATT C GTAAGAATCO TTAC?AG?GT GAGGGTAACC TATAATGTAC 
AAGAATGATT TATCTTTTGT CATGTCAAAG ATATTGGGGA GACTACCGCC TAAAAGAATT 
AGTGATAAAT TTAATATCTA TCGTCATCAA CAAATTAOGA AGCAATTAAC T CCtGTTTTT 
G ACGAGGC GT ATGAAACATT TACGAGATAT GATAGCCATA AACTAAACOA TACGATATCG 
ATTTTTTGGT GGCAAGGTGA AGAXAGTATG CCTAAGGTAG TGAAAAAATG CTATCGCTCT 
ATCCAACAGA ATOGAGGTAA AAAAAATAJT GTTTTGATCA CTCAAGACAA TATTAAACAA 
T ATACAGA CA TCCCTAAATT TATTTACGAC AAATTGGAIA AAGOAGTAAT CACTTAXACC 
CATTTTTCGC ATATTGTGAG GGCGAATTTA ATCAAAAATA ATGGTGOACT TTGGATGGAT 
CCTACGCTGT ATGTTACCTC TTCGCTA6AC AATATTGACC TAAAAAAATT ATTTTATTGT 
AGTGGCTATC CTGCTGATAC CTri'AAtGTT AGTTTCGGAC GTTGGACGGG CTTTTTTATa 
GGCGGCCCTA GCGGAATCGA CCtTTTTTCT TTTATGGATC GTCtAIATOA ACTATATTGG 
CGAGATCACG AAAAGCTXJTT TGATTATCTC TTGATAGATT ATGGATTGGA TTATGCTTGG 
MAAAAGATT TAAGTTCGTT TAAATCGCTA GAAGAGAGTT ATAAGCAAAA TAATCCTCAT 
CTGTTCGATT TGCAAGGAAT GTTAAACCAA CCGTATGATG ATAAAGAGTQ GAAAAGAATA 
ACTAGCGATA CAAGCGTATT TAAACTGTCA 7ACAAGAAAA AGGTACATTT TGATAAAAAQ 
GAAAGCTA3T ACAATAGATT GTGAAAATGA AAGACATGAC TAAAAAAACT CTATTGCAAT 
GAOQACCTAC AACGGA AGTC AGTACATTGT AGAGTTATTA GATTCTCTTC GGCAACAGAC 
ACGTCCTGrr CAAGAAGTTA TTGTCTTACC tTCCATTTGG AATGATCCAG CACTGTTAGC 
TGTGACTOTT AGCTGTGATT GAAAGTATCA CAGCAGGCAA GCCATTGATT ACTAOGTATT 
CAGGTGGGAT TCCTGAGTAT GCCGATAAGA AAGATGCGAT TATCTTOCCG ATAAATGACC 
AST TAgTTG A GAATTTAGTT AATTCGTTAA CCAAATTAGC TAACGACAAG AAATTCCGTA 
TtAGTCTTOA ATAAGCAGCT AAAAAAAGAA GTCAGACATO GACTAAGGAA AGTTTTTATO 
AJflACTTTGT AGAAATAGTA GGTTAGTAAG GTGATACGCA GTTAXGATCC TAAATCTAAfl 
TATGCGTCAG CAGTAAAAAG TCAAGTTTGT AGGAAAGGAA TCATTGTAAT GAAGTTAAGC 
ATTATTGTCC CTGTTTATAA AGTGGAAGAA TATTTOAAAfl ACTGTGTAAA TTCGAITTTA 

aatcagactt ttcatgattt ogagctcatt cttgtagatg acggttcacc agattcatgt 

CCTAAAATTT CTGATGAATA TTCTCAAAAG TTTAATAACG TTAAAGTAGT TCACAAACAA 

aatggcggat tctctagtgc TAOAAATGCT ggtatgaaag taocaactgg agagtatatt 

TCTTTTATTG ATAGTGATGA TTATCTTGCC TCAAACATGT ATGAGCATGT ATTTTCGATT 
ATGAAAAAAG AATGTGCTGA TATTGTTGTG GTGGGCAGAT GCTATGTGTA CCCAAATGGT 
TCCAAAAAAT TAAGAGAGAA ACAGAATGTG tATCAAGTTA TGGATGGCCC TAAAGCAACG 
GCCATAATGA ATACATCTTT GTTAGGGtAC TTTGATGCTG CAGCTTGGGA TAAAGTATAT 
AAACGAAGCT TGTTTAATGA CGTGAGTTAT CCCGAGGGGA AACTAACTGA AGATTGGTAT 
ACTACATAtA AAGTOTTTGC AAAAGCTAAT AGAATAGTTT ATGATTCAAC ACCCATGTAC 
TATTACAOAC AACGTGGAGG AAGTATCACC CATACAAGTT CTACAfiTTAA TTATGACGCA 
^^TGCTA GTCGAGAAOT CTATGATTTC GTAAAAAAGA GACAACCGGA GTATACGGCT 
ffySftj? TTGCATATGT TTTTTCaAGA ATTGGACTTA TAGACAATTT AACTOTtSg 
CCTACTGTTG ATAAACAAAA AATTAGGAAA ATACGTAATG ATATGAAGGC AAATATTAAA 
Sf^Ii^ AGACAGACTG TTTTTCTAAfi TTGAGTAAAA AAAGAAAAAT ACAATTGTTT 
TTAATTGAGC ATTGCTTAAA CTCATAtACA ATTATTTITA GGCGTGTAAA AAGCCTTGGC 
ATATCAGATT AAAAATAACA ATAACTACAA AGGATAAAGA ATATGTCT G T ATATTTTGGG 

^crarrr tttgtgtaat atcctcaatg atcgggcgcg gactaacaat aaatagattt 

GACATTAOAG CAAAGATAGT AGATGTATTA CCTTTTTTAG CTTTGTTTGT TGTATCTGCA 
Tn*^*Vl AAGTTGGTAA GGACTACGGT ATATATGTCG GTACCTATGA TTTAATTAAA 
ACAGGACAGC AAOCOAGAAT CGATATCTTC ACTTATTGGG TTATGAAGGT AATGGCTAGC 



3960 

4 020 

4080 

4140 

4200 

4260 

4320 

4390 

4440 

4S0O 

4550 

4620 

4680 

4740 

4800 

4860 

4*20 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

57 0O 

5760 

5820 

5880 

5940 

6000 

6060 

6120 

6X00 

6240 

6300 

6360 

6420 

6480 

6540 

6600 

6660 

6720 

6780 

6840 

6900 

6960 

7020 

7080 

7140 

7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7B00 

7860 

7920 

7980 
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TTGAATCTTG ACGTTCAGTA CTTTTTTATT GTTTCTAGTT TTATTQTAAA TTATCTAATC 8040 

TACTTAGCTG TTCGAGATCA ATCAAAAGAT AGAACACTTA GTTATTATAT ATATATATGT 8100 

GG GACtT TAT ATTTTGCCTC AATGAACACA GTTCGCCAOA TGATGAGTGT TGCTATGTTT 8160 

TACTTTTCAT TCAAATATGT CGAAAGCAAT AATTGGAAAA AATATTTTTT ATGTAATTTG 8220 

ATAGGTGGAC TTTTTCACCA AACAGCTTTT ATATTCCTGC CCATATATTT TGTTTTAAAG 8280 

AGATATATGG QQTQGAAGAA ATATTTAGTA GTAATTATTA TAGCTATAGC ACTCAAGAAC 8340 

CCAATCGTTA ATCTGCTTAA TGGGCTTATC TTAAATTCAA AATATGCGAT OTATGTCACT 84 00 

TATTCCAACT TTGCAAATAC AGCCTGGGGA GGATGGAAGA TAAGCAATTT CATTAATTTA 64 $0 

ATATTATTTT TAGCATACTG CCTTTTGCTT AAAAATAAOO ATACTGAAGA TAGTATATAt 8520 

ACTAATATTC ATTTTGTTGG GGTACTATGT TCGATTTTAC TACTTGGTAT CCCGGGTGGT 8580 

GACAQAATTT TTCTTGOOTT TAGATTTATC GAATTATTAA GTGTACCCAA CTTACTCTAT BG40 

AA ATTAA AGT TAAGAAAMT AAGCTATATT ATTTTGAGTT TAGTAATTGC AGTACXATAC 8700 

TTOTTTTACT TTTGCTATAC GATCGGCGTA CAAAATGGTA ATTCTGTACT GCCATACGTG 8760 

ACAACCCTAT TTTCAATAAA CTAATAGTAA TTTGATAGGA GTAGAACGTT GAAGTTTTTA 8820 

ATAATTGATO ATGAACGTAG CCTCTATAAA GCTATGTTCA 0TGATTTOAT AAATAGCTCG 8380 

GATAAAAATA TTTCTGAGGT ACCTATATTC AGTCAAATGC CAAGATATCT ATCGGTTGCT 8940 

AAGCCAATCG TATTTAATGA TCGGATTAAT CGACATGITJT GGCTACCGTT CAAAAAAACA 3000 

TATGATAAAT ACTATTCTCT CACATCATAT AACTTTGATA AAAOCGAAAA ATACTGGGT& 9Q€0 

GTGATGCTAA ACGGAACATT AAATA CACAC TATTCCGCTG AATATATAGC ACGATTAAAA $\2Q 

AAGGAAAAAC CGAATGTCAA GTTTOCACTT ATCATGTACG ATCATTTCGG AAATCGAGCX 9180 

GCAAOAAGAG TTAAAAAACT TTTACCGTTT TTTGATC 5217 



(2) INFORMATIONS POUR LA SBQ ID NO! 2: 
(i) CARACTEEI STIQUES DE LA SEQUENCE : 

(A) LONGUEUR; 219 acides amines 

(B) tVPE.- acide amine 1 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: linealre 
(il) TYPE DE MOLECULE: proteiue 

(xi> DESCRIPTION PE LA SEQUENCE; SEQ ID NO; 2: 

Met Asp Met Gly Tyr ser ser Ser Pro Ala Tyr Val Lys Gin ser Lya 

1 5 10 15 

Val Lys Gly Arg Pro Leu Tyr flia Gly He Lys Arg Leu Phe Asp Phe 

20 25 30 

Leu Ala Ser Ser He Ala Leu He Leu Leu ser Pro Leu Phe Leu Trp 

35 40 45 

Leu Ala He Lys He Hie Gly Glu Asp Gly Gly Pro Val Phe Tyr Ser 

50 55 60 

Gin He Arg He Gly Ly* Asp Glu Lys Pro Phe Arg He Tyx Lya She 
65 „ ™ 75 no 

Arg Ser Met Val Val Asa Ala Glu Lys Leu Lys Lya Asp Leu Leu Glu 

85 $0 9S 

Gin Aen Glu Val Glu Gly Ala Met Phe Lys Met His Asp Asp Pro Axo 

100 105 no 

He Thr Lys He Gly Lya Phe He Arg Ala His Ser Leu Asp Glu Leu 
115 120 125 

Pro Gin Leu Trp Asa Val Leu He Gly Asn Met ser Leu Val Gly Pro 

130 135 140 

Arg Pro Pro Leu Pro Asn Glu Val Glu Gin Tyr Thr Asp Tyr Asp Lys 
145 150 155 i60 

Gin Arg Leu Leu val Lys Pro Gly Cys Ser Gly Leu Trp Gin Ala Thr 

165 170 175 

Ser Arg Asn Ala Ala Asp Phe Ala Asp Met Val Gin Leu Asp He Glu 

180 185 iso 

Tyr He Asn Arg Ser Gly Val Phe Phe Asp Leu Trp He He Phe Lys 

1^5 200 2os 

Thr He Gly Val Met Phe His Pro Asn Gly Met 
210 215 

16 
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(2> INFORMATIONS POUR LA SEQ ID NO; 3: 

(i) CARACTERISTIQUSS OS LA SEQUENCE = 

(A) LONGUEUR: 26$ AC ides amin6s 

(B) TYPE: acide amine 

(C) NOMBRS DE HRINS : simple 

(D) CONFIGURATION : lineaire 
(ii) TYPB DE MOLECULE: protelne 



15 



30 



35 



40 



(xi) 


DESCRIPTION 


DE LA SEQUENCE: 




JO- 1 - 








Met 


Lvs 


Gly 


Asn 


Asn 


Lys . Pro 


Arg 


Leu Leu 


y L JT LLC. 


Val 


Glu 


Ala Met 


1 






5 






4 v 










Gly 


uiy 


Slv 


Val 


Phe 


Thr Tyr 


He 


val Asp 


Leu A13 




day* 


t,aii v»l 


20 








2b 






o v 




Asp 






***** 


val 


Tyr lie 


Glv 


Tyr Ala 


Met Arg 


A9n 


Gin 


Tnr Pro 




35 








40 










biu vai. 


ain 


Attn 


iyr 




Glu 


Tvr Phe 


Asd 


Glu Arg 


Val His 


Leu 


lie 








55 






if n 
Ov 






Aia Giy 


Lys 


Han 


Phe 


Ala 




Ser Thr 


Ser 


He Thr 


Lys Ala 


lie 


Lys 










70 






75 






on 


Gin 


SJJLU 


Met 




Ara 


He Ala 


Lvs 


Ala He 


Arg Pro 


Asp 


val 


lie HIS 








85 






90 










Leu 


nij 


fier 

PCi 


Ser 


He 


Ala Gly 


Ala 


He Gly 


Arg Val 


val 


pne 


Asn Thr 








100 






105 






HQ 




Lys 




Thr 


Pro 


val 


Phe Tyr 


Thr 


Pro »ia 


Gly Tyr 


Ser 


•alt a 

p«e 


W&U net 


115 








120 










GlU Glu 


Gin 


wiy 


Glu 


Ser 


Ser 


Lys Lys 


Ara 


Leu Ala 


Tyr Lys 


t ^«ft 

lieu 


vai 




130 








135 






140 








Phe 




uiy 


T.VS 


Ser 


Gin Ala 


Thr 


Thr He 


Ala Cys 


Ser 


Pro 


Gly GlU 


145 




150 






155 








TVr 




GlU 


Ala 


Leu 


Lys val 


Ser 


Lys Kis 


Ala Val 


GlU 


vai 


Asp Asn 








155 




170 










Gly 


lie 


Asn 


He 


Glu 


Gin Leu 


Gin 


Glu Leu 


lie Asp 


Tnr 


inr 


Asp Ala 






180 








185 






l?v 




Ser 




He 


Asp 


Rio 


Tyr Asp 


val 


Phe Thr 


Leu Gly 


Arg 


ne 


ser vai 




195 








200 






one 






<Jln 


Lys 


Asn 


Pro 


Asn. 


Val Phe 


Asn 


Glu Val 


Ala Leu 


Lys 


Leu 


Ser Asn 




210 








215 






220 








Leu 


Lys 


Phe 


Leu 


Trp 


lie Gly 


Asp 


Gly Glu 


Leu Arg 


ser 


UIU 


Leu Tnr 


225 








230 






235 






240 


Ala 


Pro 


Asn 


lie 


Thr 


Val Thr 


Gly 


Trp Leu 


Thr Arg 


His 


Glu 


Ala Leu 










245 




2S0 






255 


Lys 


Tyr 


Ser 


Leu 


Asn 


Ser Asp 


Thr 


Phe Met Leu Thr 


Ser 


Leu 


Trp Glu 




260 








265 






270 




Gly 


Leu 


Pro 


Met 


ser 


Leu Leu 


GlU 


Ala Net Tyr net 


Lys 


Lys 


Leu Cys 




275 








280 






285 




Val 


val 


Ser 


Asp 


val 


He Gly 


Asn 


His Asp Val He 


Asn 


Asp 


Gly Val 




290 












300 








Asn 


Gly 


Tyr 


val 


Cys 


Gin Thr 


Val 


Asn Asp Phe Tyr 


Asn 


Arg 


He Ser 












310 






315 






320 


Net 


He 


Gly 


Gly 


Ala 


Arg Tyr 


Ser 


Leu He Asp Cys 


Ala 


Tyr 


Lys Asp 






325 






330 








335 


Val 


Leu 


Glu 


Arg 


Tyr 


Asn Thr 


Lys 


val val Ser Lys 


Ala 


Tyr 


Asp Gin 








340 








345 






350 




Leu 


tyr 


Gin 


Ala 


Ala 


lit Lys 


Asn 


Ser Glu Cys Phe 


Cys 


Leu 






355 








360 






365 







45 



(2) INFORMATIONS POUR LA SEQ ID NO: 4: 
(1) CARACTERISTIQUES OS LA SEQUENCE; 
(A) LONGUEUR: 375 acides amines 
(3) TYPE: acide amine 

(C) NOMBRE DE BRINS; Simple 

(D) CONFIGURATION: lineaire 
(il) TYPE DE MOLECULE: protein* 
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(xij DESCRIPTION DE LA SEQUENCE: SEQ ID KO; 4: 

Met oln L/a He Arg Val Val Hia Val Ala Glu Ala Ala Gly Gly Val 
IS 10 15 

Glu Arg Tyr Leu Tyr Ala Leu Leu Lys Asn Ser Asp Ser Gin Lys He 

20. 25 30 

Glu Ada Tyr Leu lie Ala ser Gin His Tyr Glu Met Gly Lys Phe Lys 

35 40 45 

Lys Tyr Val Ser Gly Glu Tyr Gin Leu Gin Met Ala Hie Ala Ala cys 

50 55 60 

Phe Lys Asn Asp Lys Ala Thr Val tya Gin lie Lys Lys Thr val Arg 
«5 70 75 BO 

Gin Xle Lya Pro Asp He Val Tyr Ala His Ser Thr Lys Ala Gly Ala 

95 90 95 

Leu Thr Arg He Ala Leu Met Gly Met His He Pro Val Xle Tyr Asn 
100 105 110 

, 5 Pro His Gly Trp Ala Phe Asn Met Ala Gin Ser Lys Lys Lys Glu Leu 

115 120 125 

Ala Tyr Arg Leu He Glu Lys Val Gin He Pro Phe Thr Lys Lys Val 

130 135 140 

Val Cys Xle Ser Glu Ala Glu Met Gin Ser Ala Met Gin Lys Hia He 
145 150 155 160 

cys Sex Lys Asp Lya He Lys He He Pro Asn Gly Xle Asp Phe Asp 
20 165 170 175 

Leu Leu Asp Lys Val Gin Pro Val Thr Arg Arg Asp Leu Gly He Leu 

180 185 150 

Glu Asp Ala Phe Val Val Gly Gin He Gly Arg Leu Ser Glu Gin Lys 

195 200 " 205 

ser Pro Asp val Phe val olu Met Ala Glu Lys Xle Lys Lys Glu lie 
_ 210 215 220 

25 Pro Asn Ser Phe Phe val Met Val Gly Asp Gly Asn Leu Glu Ala Glu 

225 230 335 240 

He Arg Arg Leu lie Lys Ser Lys Gly Leu Glu Asp Ser Phe Leu He 

245 250 255 

Thr Gly Trp Val Asp Aon Pro Thr Gly Tyr Leu Asn Cys Phe Asp Val 
260 265 270 

30 ser Thr Leu Leu Ser Arg Trp Glu Gly Phe Gly Leu Ala Leu Val Glu 

275 280 285 

Tyr Met Tyr Cys Gly val pro Leu val Ser Thr Lys Val Asp Ala He 

3*0 295 300 

Pro Tyr val val Asp Asp Gly Val Asp Gly Leu Leu Val Glu Pro Asp 
305 310 315 320 

Asn Pro Tyr Glu Ala Ala Lys Ala Val Xle Arg lie His Glu Aap Pro 

325 330 335 

Ala Leu Ala Ala Lys Phe Val Ala Asn Gly Leu Ser He Ala Lys Asp 

340 345 350 

Lys Tyr Asp val Arg Arg Val Ala Lys Gin Thr Leu Lys Leu Tyr Tyr 

155 360 365 

Lys Val Leu His Asn Leu Lys 
370 375 



ss 



(2) INFORMATIONS POUR LA SEQ XD NO: 5; 
(i) CARACTKRISttQUES DE LA SEQUENCE : 
45 (A) LONGUEUR: 268 acidee amines 

(&} TYPE: acide amine 

(C) NOMBRS VE BRIN5: simple 

(D) CONFIGURATION: lineaire 
(ii) TYPE OS MOLECULE: proline 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO- S- 




7 . 3 10 15 

Lys Ala Leu Glu Lys Ser He Clu Ser lie He Asp aln Thr Tyr Ser 
20 25 30 



55 
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Asp Trp alu Phe lie He Tyr Asn Asp Gly Ser Glu Asp Asp Gly Lys 
35 40 " 45 

Thr Ser Glu Tyr Leu Lyg Lys Leu Gly Lys Arg Asp Ser Arg He Gin 

50 55 $o 

lie lie Asp Cys Pro Asn ten His Gly Leu Ala Tyr Ala Lys Asn Glu 
65 ™ 75 so 

Met He Lya Val Ala Arg Qly Asp Tyr He Thr Ala Gin Asp Asp Asp 

B5 90 95 

Asp Val Ser His pro Met Arg Leu Ala Arg Glu Val Asp Phe Leu Asn 

100 105 no 

Arg His fro Glu Tyr Ala phe val Gly Thr val Ala Lys val phe Asp 

115 120 125 

Asn Ser Gly Thr Trp Gly His Tyr Gly Leu Lys Glu Lys Pro Thr Lys 

130 135 140 

Asn Thr Phe Leu Trp Asn ser Pro Phe Leu His pro Ser Val Met Phe 
H5 150 155 

Arg His Glu val Leu Asp Gin val Asn Gly Tyr Arg Val Ala Lya Asn 

165 170 1?5 

Thr Met Arg Ala Glu Asp Tyr Asp Leu Phe Phe Arg Leu Tyr Ala Lya 

1*0 1S5 i$o 

Gly Tyr Lys Gly Tyr Asn He Gin Glu Asp Leu Tyr Glu Tyr Arg He 

195 200 205 

Glu Asn Asn Pro Asn Lya Lys Tyr Arg pro Wet Ser Asp Arg He Gin 

210 215 
Glu Ala Lys Val Arg Tyr Lys Gly Phe Lys Ser Phe Gly Met Leu Thr 
325 230 235 240 

Lys Gly He Pro Tyr He He Lys Pro He Leu He Gly Leu He Pro 

245 250 255 

Gin Lys He Phe Tyr lie He Arg Lya Asn Arg Tyr 
260 265 



25 



35 



SO 



(2) IHPOftMATIOKS POUR LA SEQ ID HO: 6: 

(i) CARACTERISTIQUES Dfi LA SEQUENCE: 

(A) LOUGUEUR: 2d 9 acides amines 

(B) TYPE: aeide amine 

(C) NOMBRS DE BftltfS: Simple 
<D) CONFIGURATION: Uneaire 

(il> TYPE DE MOLECULE* protftifie 

(Xl> DESCRIPTION DZ LA SSQUBffCE: SEQ IB NO: 6; 



Met Tyr Lya Asn Asp Leu ser Phe Val Met Ser Lya He Leu Gly Arg 
IS 10 15 

Leu Pro Ala Lys Arg He Ser Asp Lya Phe Asn He Tyr Arg His Gin 

20 25 30 

Gin He Arg Lys Gin Leu Thr Pro Val Phe Asp Glu Ala Tyr Glu Thr 
35 40 45 

40 Phe Thr Arg Tyr Asp Ser His Lys Val Asn Asp Thr He Trp lie Phe 

50 55 6q 

Trp Trp Gin Gly Glu Asp, Ser Met Pro Lys val Val Lya Lys Cy* Tyr 
65 7 0 75 bo 

Arg Scr He Gin Gin Asn Arg Gly Lys Lys Asn Tie Val Leu He Thr 

85 SO 95 

Gin Asp Asn He Lys Gin Tyr Thr Asp He Pro Lys phe He Tyr Aso 
45 100 105 HO 

Lys Leu Asp Lya Cly Val He Thr Tyr Thr His Phe ser Asp He val 

US 120 125 

Arg Ala Asn Leu He Lys Asn Aan Gly Gly Leu Trp Het Asp Ala Thr 

130 135 140 

Leu Tyr Val Thr ser Ser Leu Asp Asn He Asp Leu Lys Lys Leu Phe 

„ ISO 155 1€Q 

Tyr Cys ser Gly Tyr Pro Ala Asp Thr Phe Asn Val ser Phe Gly Arg 

165 170 iic 

Trp Thr Gly Phe Phe Met Gly cly Pro Ser Gly Met Aap Leu Phe Ser 

180 i 95 r 190 
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Phe Met Asp Arg lieu Tyr Glu val Tyr Trp Arg Asp Hi* Glu Lys Leu 

195 200 205 

£he Asp Tyr Phe Leu lie Asp Tyr Gly Leu Asp Tyr Ala Trp Lys Lys 

210 215 220 

Asp Leu Ser Ser Phe Lye Ser Leu alu Glu ser Tyr Lys Gin Asn Ann 

225 230 235 240 

Pro Hie Leu phe Asp Leu Gin Gly Met Lau Asn Gin Pro Tyr Asp Asp 

245 250 255 

Lya Olu Trp Lys Arg He Thr Ser Asp Thr Ser Val Phe Lys Leu Ser 

260 265 270 

Tyr Lys Lys Lys Val Asp Phe Asp Lys Lys Glu Ser Tyr Tyr Asa Arg 
275 280 285 

Leu 



(2) INFORMATIONS POUR LA SEQ ID NO: 7; 

(i) CARACTSRX9TJQUES DE LA SEQUENCE: 

(A) LONGUEUR; 327 acides amines 

(B) type: acide amin£ 

<C) NOM&RS DE BRINS ; simple 
M (D) CONFIGURATIONS linfcaire 

20 (ii) TYPE DS MOLECULE: proteine 

(xi) DESCRIPTION DS IA SEQUENCE; SEQ ID NO: 7: 

Met Lys Leu ser lie tie Val Pro Val Tyr Lys Val Glu Glu Tyr Leu 
15 10 IS 

Lys Asp Cys Val Asn Ser lie Leu Asn Glu Thr Phe His Asp Phe Glu 
& 20 25 30 

Leu lie Leu Val Asp Asp Gly Ser Pro Asp Ser cys Pro Lys lie cys 

35 40 45 

Asp Glu Tyr ser Gin Lys Phe Asn Asa Val Lys val val His Lys Gin 

50 55 60 

Asn Gly Gly Leu Ser Ser Ala Arg Asn Ala Gly Met Lys Val Ala Thr 
65 70 75 SO 

30 Gly Glu Tyr lie ser Phe He Asp ser Asp Asp Tyr Leu Ala Ser Asn 

85 SO 95 

Net Tyr Glu His val Phe ser He Net Lys Lys Glu cys Ala Asp tie 

100 105 110 

val val val Gly Arg Cys Tyr Val Tyr Pro Asn Gly fier Lys Lys Leu 
115 120 125 

„ Arg Glu Lys Gin Asn Val Tyr Glu Val Net Asp Gly Pro Lys Ala Thr 

35 130 135 140 

Ala He Met Aon Thr Ser Leu Leu Gly Tyr Phe Asp Ala Ala Ala Trp 
145 150 155 160 

Asp Lys Val Tyr Lys Arg Ser Leu Phe Asn Asp val 8er Tyr Pro Glu 

165 170 175 

Gly Lys Leu ser Glu Asp Trp Tyr Thr Thr ryr Lys val Phe Ala Lys 
40 180 185 190 

Ala Asn Arg He Val Tyr Asp Ser Thr Pro Met Tyr Tyr Tyr Arg Gin 

155 200 205 

Arg Gly Gly ser He Thr His Thr ser ser Thr Val Asn Tyr Asp Ala 

210 215 220 

Met Tyr Ala Ser Arg Glu val Tyr Asp Phe Val Lys Lys Arg Gin Pro 
225 230 235 240 

45 Glu Tyr Thr Ala Glu Ala Asn Phe Ala Tyr Val Phe Ser Arg He Gly 

245 250 255 

val lie Asp Asn Leu Thr val Gin Pro Thr Val Asp Lys Gin Lys He 

260 265 270 

Arg Lys He Arg Asn Asp Met Lys Ala Asn He Lys Gin Leu Lys Lys 
275 280 285 

Cys Phe set Lys Leu Ser Lys Lys Arg Lys He Gin Leu Phe 
50 290 295 300 

Leu He Glu His Cys Leu Asn Ser Tyr Thr He He Phe Arg Arg val 
305 310 315 * * 320 
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Lys Ser Leu Gly lie Ser Asp 

325 



(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CAftACTER ISTIQ UBS DE LA SEQUENCE: 

(A) LONGUEUR: 114 aeides amines 

(B) TYPE: acide amine" 

10 (C) NOMBRE DE BRIVS: simple 

(D) CONFIGURATION: lin6aire 
(ii) TYPE DE MOLECULE : proline 
(Xi> DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 



75 



Met His Ser Xaa phe Asn val Ser Xas xaa Asn xaa Leu Thr thr Leu 
15 10 1$ 

Leu Tlir Ser Arg Ser Met Glu Met Asp Ala Asa Ser Val He Arg Glu 

20 25 30 

Ser Gly val Glu Asn. Leu Ser lie Leu Thr Ala Gly Pro He Pro Pro 

35 40 45 

Asn Pro Ser Glu Leu Leu ser ser Lys Hie Met Leu Asp Leu He Glu 

50 55 60 

Asp Leu Lys Gin Glu Tyr Asp Met Val Val Leu Asp Leu Ala Pro He 
20 65 70 75 80 

Leu Asp Ala Gly Glu Thr Gin Gin Lea Thr Ser Ser Leu Asp Gly Thr 
85 90 9S 

He Leu Val Val Arg Gin ser Tyr ser Gin Lye Ser Ala Val Lya Arg 
100 ios no 

Gly Ser 



(2) INFORMATI ONS POUR LA SEQ ID NO: 9; 

(i) CAEACTE RX ST IQ UES DE LA SEQUENCE; 
(A) LONGUEUR: 258 acidea amines 
(S) TYPE: aelde amine* 

(C) NOMBRE DE BRXNS; simple 

(D) CONFIGURATION : lin*aire 
(ii) TYPE DE MOLECULE: prottfiue 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9- 



30 



35 M<5t Pro Va * Asp Leu His Cys His He Leu Pro Gly He Asp Asp 

1 5 10 15 

Gly Ser Lye ser xrp Glu Ala ser Leu Lys Leu Ala Arg Ala Ala Val 

20 25 30 

Ala Asp Gly Val Thr His Ala Leu Cye Thr Pro Hie Thr Leu Asn Gly 

35 40 45 

Arg Tyr Thr Asn His Lys Glu Asp Val He Lys Leu Thr Glu Glu Phe 
40 50 55 60 

Gin Asp Arg He Asp Gin Ala Gly He Pro Leu Thr Val Phe Pro Gly 
65 70 75 80 

Bis olu Val Arg Leu ser Gly Oly Leu Thr Glu Ala Leu Asp Asn Asp 

85 90 95 

Asp He Leu Phe Cys Asp Glu Glu Gly His Tyr Met Leu Leu Glu Leu 
100 105 110 

*s Pro ser Asn olu Val Pro His Tyr Thr Lys Asn Met Val Tyr Olu Leu 

115 120 125 

Thr Arg Arg Gly He Thr Pro He val Val His Pro Glu Arg Asn Lys 

130 13$ 140 

Lys lie Leu Ala Asn Pro Gin Lye Leu Gin Glu Phe Leu Glu Met Gly 
145 150 155 ISO 

Val Leu Val Gin He Thr Ala Ser Ser Tyr Thr Gly Leu Phe Gly Lys 

1^5 170 175 

Glu He Olu Asp Cya Ser Arg Glu Phe He Lys Ala Gly Gin Cys Ala 
100 185 190 
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Phe Phe Ala Ser Asp Ala Hie Asp 
195 200 
Ser Glu Ala Leu Asp Lys teu Ala 

210 215 
Gin Lys Tyr Leu Asp Asn Ala Gin 
225 230 
Tyr Leu Asn Trp Gin Pro Lea Pro 
245 

Leu Phe 



Leu Pro Arg Arg Gin Tyr Gin Leu 
205 

Lye Glu Phe Gly Glu Asp Lye Lys 
220 

Ala Val lie Asn Gly Asp Pro Val 
235 " 240 

Lys Lys Arg Lys Lys Phe Leu Gly 
250 255 



SO 



(2) INFORMATIONS POUR LA SBQ ID NO: 10: 

(i) CAftACTERISTXQUSS DE LA SEQUENCE: 
(A) LONGUEUR: 353 acides amines 
r - (B) TYPE: acide amine 

{C> NOMBRE PB BRXNS: Simple 
(O) CONFIGURATION : lineaire 
(ii) TYPE DE MOLECULE: proteine 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ XD NO: 10: 

Met Ser Val Tyr Phe Gly Leu Leu He Phe cys Val He Ser Ser Met 
2Q 1 5 10 15 

He Gly Arg Gly Leu Thr He Asn Arg Phe Asp lie Arg Ala Lys He 

20 25 30 

Val Asp Val Leu Pro Phe Leu Ala Leu Phe Val Val Ser Ala Phe Arg 
35 40 4S 

Tyr Gin Val Gly Lys Asp Tyr Gly He Tyr Val Gly Thr Tyr Asp Leu 

SO 55 60 

25 He Lys Thr Gly Gin Gin Ala Arg He Asp He Phe Thr Tyr Trp Val 

65 70 75 00 

Met Lys val Met Ala Ser Leu Asn Leu Asp val Gin Tyr Phe Phe He 

85 90 $5 

Val Ser Ser Phe He Val Asn Tyr Leu He Tyr Leu Ala Val Arg Asp 

100 105 110 

Gin Ser Lys Asp Arg Thr Leu Ser Tyr Tyr He Tyr He Cys Gly Thr 

115 120 125 

Leu Tyr Phe Ala Ser Met Asn Thr Val Arg Gin Met Met Ser Val Ala 

130 135 " 140 

Met Phe Tyr Phe Ser Leu Lys Tyr val Glu Ser Asn Asn Trp Lys l»ys 
145 150 1SS ISO 

Tyr Phe Leu Cys Ann Leu He Gly Gly Leu Phe His Gin Thr Ala Phe 

165 170 175 

He phe Leu Pro He tyr Phe Val Leu Lys Arg Tyr Met Oly Trp Iiyo 

180 185 190 

Lys Tyr Leu val Val Ha He He Ala He Ala Leu Lys Asn Pro He 

195 200 205 

Val Asn Leu Leu Asn Gly Leu He Leu Asn Ser Lys Tyr Ala Met Tyr 

210 315 220 

Val Thr Tyr Ser Asn Phe Ala Asn Thr Ala Trp Gly Gly Trp Lys He 
225 230 235 240 

Sar Asn Phe He Asn Leu He Leu Phe Leu Ala Tyr Cys Leu Leu Leu 

245 2S0 255 

Lys Asn Lys Asp Thr Glu Asp Ser He Tyr Thr Asn He His Phe Val 
2*0 265 270 

45 Gly Val Leu cya ser He Leu Leu Leu Gly He Pro Gly Gly Asp Arg 

275 280 285 

He Phe Leu Gly Phe Arg Phe He Glu Leu Leu Ser Val Pro Asn Leu 

290 295 300 

Leu Tyr Lys Leu Lys Leu Arg Lys He Ser Tyr He He Leu Ser Leu 
305 310 315 320 

Val He Ala Val Leu Tyr Leu Phe Tyr Phe cys Tyr Thr He Gly Val 

"5 330 335 

Gin Asn Gly Asn Ser Val Leu Pro Tyr Val Thr Thr Leu Phe Ser He 
340 345 350 

Asn 
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(2) INFORMATIONS POUR LA SgQ ID MO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE; 

(A) LONGUEUR: 26 paires de bases 

(B) TYPE: nucl€otid* 

(C) NOMBRE DE BRINS ; simple 

(D) CONFIGURATION." lineaire 

(ii) TYPE DE MOLECULE: Autre aeide nucl,igue 

(A) DESCRIPTION: /deec * " amorces ■ 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: XI: 

GAYGARYTNC CNCARYTNWK NAAYGT 



26 



15 



20 



25 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(1) CARACTERISTIQUES DB LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DB MOLECULE: Autre acide rtucl,ique 
<A) DESCRIPTION: /deac * "amorces* 
DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

CCANHRNCCN GTNANCCNQG YTT 
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Revendicattons 

1 . Enzyme recombinee, susceptible d'etre imp&quee dans fa bkttyntftese de I'EPS ayant I'unite saocharidique repeti- 
tive 



40 



P-D-Gajp a-L-Rhap p-D-Galp 

i 1 1 

I I I 

4 3 3 
►3)-|3-D-Gal;>(l--^)-a-^^ 



4S 



BO 



55 



catalysant specif iquement I'une des liaisons suivantes entre Sucres: 

- la Baison o&idique p-1 ,3 entre le carbone 1 d'un D-Galp active et le carbone 3 du Sucre present a I'ertremite 
non-reductrice dune chalhe saccharidique en formation, ladite chatne etant compose* d\ine chaTne principal e 
de 1 a 4 D-Galp et/bu D-Gtep lies entre-eux par des liaisons osidiques a-1,2, a-1,3, p-1 ,4 et/ou .3, et !sdt 
sucre present a I'extremite non-reductrice etant lie a un seuf autre Sucre par son carbone 1 ; 

- la liaison o&idique p-t,4 antra le carbone 1 d'un D-Galp active et le caibone 4 du sucre present a I'extremite 
non-reductrice tf une chatne saccharidique en formation, ladite chalne etant composee (Tunechalne princfcale 
da 1 a 4 D-Galp et/bu D-Gtep lies entre-eux par des liaisons osidiques <x-1,2, cc-1,3, p-1 .4 et/ou $-1.3. et ledit 
sucre present a I'extremite non-reductrice etant He a un seul autre Sucre par son carbone 1 : 

- (a liaison osidique a-1,3 entre le carbone 1 d'un L-Rhap active et le caibone 3 du Sucre present a i'extremite 
non-reductrice dune chains saccharidique en formation, ladite chatne etant composee cTune chaTne principaJe 
de 1 a 4 D-Galp et/ou D-Glcp lies entre-eux par des liaisons osidiques a-1 ,2, a-1 ,3, p-1 ,4 et/bu p-1 .3, et ledit 
sucre present a I'extremite non-reductrice etant lie a un seul autre sucre par son carbone 1. 
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2. Enzyme recombin4e notamment selon la reveridication 1, ayant la sequence en acides amines choisie dans le 
groupe forme par !es sequences SEQ ID NO:2, SEQ ID NO:3. SEQ ID NO:4. SEQ ID NO:5, SEQ ID NO:6. SEQ 
ID NO:7. SEQ ID NO;8. SEQ ID NO:9, SEQ ID NO:10, et les sequences qui leur sort homologuea 

ADN recornbin6e codant pour une enzyme selon la revocation 1 ou 2. 

4. ADN selon la revocation 3, comprenant au moins un g6ne ayant une sequence nuc!6otidique choisie parmi ies 
sequences daimrfces dans la sdquence SEQ ID NO:l par les nucleotides 9-353, 516-1292. 1323-1982, 2074- 
31 74, 3246-4373, 451 1-531 7. 5335-6204. 6709-7692, 7723-8734. el les sequences qui leur sent homologues. 

5. Vectaur recombinant comprenant un ADN selon la revendication 3 ou 4. 

6. Cellule comprenant, Integra dans son genome ou par le moyen dXin plasmide repficable, un ADN recombme selon 
la revendication 3 ou 4. et exprimant une enzyme recombinSe fonctionnelle seton la revendication 1 ou 2. 

7. Cellule salon la revendication 7, caract6ris6e en ce quH s'agit d* une bacterie lactique. 

8. ProcW6 de production d*un EPS. dans iequef (1) on clone dans un vecteur un fragment d'ADN codant pour au 
moins Tune des enzymes selon fa revendication 1 ou 2. ledit vecteur comprenant en outre une sequence parmet- 
tant la replication autonome ou rint6gratton dans une cellule hdta, (2) on transtorme une ceHule hftte par ledit vec- 
teur. iadite cellule note utilisant les enzymes cod6es par le vecteur. le cas 6ch6ant en combinaison avec d'autres 
enzymes produhe par la cellule hdte. pour la biosynth&se d'un EPS, (3) puis on cuftive la cellule hOte transformed 
dans des conditions appropriees pour la production (fun EPS 

9. Proc&te selon la revendication 8, dans fequel le vecteur comprend en outre au moins une sequence promoteur 
fonctionnelle et au moins une sequence deactivation traductionnelle fonctionnefle. permettant I'expression des ADN 
codant pour au moins Tune des enzymes selon la revendication 1 ou 2. 

10. Utilisation d k une enzyme recombin6e selon la revendication 1 ou 2. ou d'un ADN salon la revendication 3 ou 4, pour 
la synthase d'un EPS. 
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